テキスト分析によるデータサイエンスとその応用

取り組みテーマ分野:<スマート農業・看護・観光・ファクトリー>

研究者:砂山 渡(工学部・電子システム工学科 )

 データ分析とその応用全般に関しては、本センターのスマート化に関わる根幹をなす部分といえます。その中でも、テキストデータは、数値データよりも分析に必要とされる手法がより複雑で困難となることが多いとされています。
 本研究では、そのようなテキストデータの分析について、砂山渡教授が長年開発してきたテキスト分析ツール・TETDM(https://tetdm.jp、フリーソフトウェアとして無料入手・活用可能)をベースとして、説明されています。下図に示すような手順は、すべてのデータ分析において行われるものであり、数値データの場合には種々の人工知能系のツールが充実し、自由に利用可能となっています。しかし、テキストの場合は、まずその中の情報を分類・整理して「分析」「可視化」する部分について、これまでは文章の読み手の主観に頼っているきらいがありました。本研究では、その部分も自動化しつつ、「結果の収集」「解釈の集合」の部分についても手順化し、人間が知識を得て意思決定することを可能としています。実例として、アンケート結果の分析について、TETDMによる操作例も示されています。
 なお、TETDMに関する解説書籍を砂山教授自身が出版しており、そちらもご参照下さい(砂山渡、「フリーソフトTETDMで学ぶデータ分析」(コロナ社、2020年))。

▲テキスト分析ツール:TEDDM


▲データ分析による意思決定手順。本研究では、特にテキスト情報の場合の分析手順を説明している。


2022年03月31日