- 主語+助詞+述語によって構成される意味チャンク(意味のかたまり)に着目してテクストデータを分析
ex.「イチローが松坂を誉めた」 「イチローを松坂が誉めた」⇒この違いを把握したい!
- 単語レベルの形態素解析、係り受けに基づく構文解析とあわせて、意味チャンクの考え方に基づく解析ロジックを開発
- テキストマイニングは、「イチロー、松坂、誉める」といった単語の頻度や、「イチロー−誉める」「松坂−誉める」といった係り受けを抽出してテキスト内容の推定を可能にする。
- テクスト意味空間分析は、 「イチローが松坂を誉めた」「イチローを松坂が誉めた」という、有意味なテクストが何件あるのか、確定して提示する。
- テクストデータが持つ意味は、もともと多義的で、コンピュータがその解釈を行うことは困難という立場から、「コンピュータは解析作業を行い、人間が意味を解釈するための支援ツールである」という設計思想にたつ。
|