文書にはさまざまな観点から複雑さがあります。たとえば、圧縮率や、ゆらぎ
の度合いなどです。複雑さは、文書がどの程度「推論」に基づくものであ
るか、により異なります。たとえば、数学の証明のコーパスは、文学作品よりも、圧縮率は大きいです。法律文書のように、自然言語の文書の中でも、推論に基づく文書は、数学の証明に似た性質を持ちます。推論の度合いと複雑さの関係を調べ、法律文書やプログラムの工学に必要な言語モデルを考えています。

Categorized in: