Strahler数はもともと川の分岐の複雑さを特徴付けるために提案され、自然言語の文の木構造にも応用されています。自然言語の文のストラーラー数は、文法的に注釈付けされたデータを通じた測定で、ほぼ3または4であると報告されています。この数値は、文を処理する際に必要なメモリの下限を示すものであり、文の長さに応じて対数的に増加することが確認されています。

参考文献
  • Kumiko Tanaka-Ishii and Akira Tanaka. Strahler number of Natural Language Sentences in Comparison with Random Trees. Journal of Statistical Mechanics, 2023, 1234034. Honorably selected for JSTAT Scientific Directors for the Highlights collection 2024. link arxiv

Categorized in: