Strahler数はもともと川の分岐の複雑さを特徴付けるために提案され、計算木などに応用されてきました。この研究では、Strahler数を自然言語の文の木構造の複雑さを計測するために適用しました。自然言語の文のStrahler数の上限と下限が、3から4になることがわかりました。この数は、文を処理する際に必要なメモリ領域の数を示し、文の長さに応じて対数的に増加するものです。

参考文献

  • Kumiko Tanaka-Ishii and Akira Tanaka. Strahler number of natural language sentences in comparison with random trees. Journal of Statistical Mechanics, 2023, 1234034. Honorably selected for JSTAT Scientific Directors for the Highlights collection 2024. [link] [arxiv]

Categorized in: