社会実践に向けたテキスト分析のための統合環境

研究者:砂山 渡(工学部電子システム工学科)

 テキスト分析のためのさまざまなツールを統一的に扱うための環境TETDM(http://tetdm.jp)(図1)の構築を行っています。本環境にはテキスト分析のための40種類以上のツールと、30種類以上の可視化のためのツールが備えられています。これら既存のツールと、目的に応じて新規に追加されるツールとを組み合わせて用いることで、農業,看護,観光を初めとする多様な目的に対応できるデータ分析環境を構築しています。
 データとしては、ニュース記事、アンケートデータ、日誌や日報などのデータ、掲示板やSNS等のコメント集合、など電子的に集められるテキストは全て分析対象となります。現在は、Rによるデータマイニングと組み合わせた分析や、ディープラーニングによる学習結果を用いた文章分析、など,実用的な分析環境とするための改良を行いながら、地域との連携可能性を探っています。
 人間とコンピュータの知的な協働作業によって、コンピュータによる結果の提示にとどまるのではなく、人間の意思決定における具体的なアイデア生成までを全体の枠組みとして捉え、その一連の手順を支援する環境とするべく研究を進めています。

図1. テキストマイニングのための統合環境TETDM(図は浦島太郎のテキストの中で,浦島,亀,リュウグウ,乙姫などの主題に関連する単語の出現状況を可視化している)

2017年04月14日