感情・意志分析

人々の生活はコンピュータに依存するようになり、個人がWeb上に情報を配信する機会が多くなっている。こうしたテキストを分析することで、人々がどのような出来事に対してどのような感情を抱いたか、どのような意思を持って発話しているかを知ることは企業や行政のサービス向上にとって重要である。このような背景から、テキストマイニングツールSTMに、感情・意志分析機能を追加した。


感情カテゴリと感情語辞書、慣用句辞書、顔文字辞書

感情表現辞書(中村明著,東京堂出版 (1993))を参考することとし、こちらで採用されている基本感情10種類{ 喜・ 怒・ 哀・ 怖・ 恥・ 好・ 厭・ 昂・ 安・ 驚 }を感情カテゴリとして分類することとした。この分類をもとに、感情を表す言葉の語意(EDRの概念ID)からなる感情語辞書、複数の語の組み合わせで感情を表す慣用句辞書、感情を表す顔文字辞書を作成した。




まず感情表現辞書から、のべ1513個の感情表現を種表現として取り出し、SAGEを用いてそれらの語意を決定した。さらにEDRの単語辞書の各語の語義説明をSAGEで解析しその中に種表現の語意を含む単語の語意を新たに種表現に追加することを繰り返すことで、より多くの感情表現を網羅的に抜き出した。この際、語意と感情カテゴリの割り当てを手作業で確認・修正した。この結果、計2528個の語意を感情語辞書に登録した。くろご式慣用句辞典(http://www.geocities.jp/tomomi965/)中の表現をSAGEで解析し、感情カテゴリの割り当てを手作業で確認・修正し、総計3120個の感情を含む慣用句を慣用句感情辞書に登録した。顔文字の抽出には@コスメなどのレビューサイトを調査し、総計107個の顔文字に対する感情カテゴリの割り当て行い顔文字辞書とSAGEの日本語単語辞書に登録した。


意志カテゴリとモダリティ

文(例:今日は、雨が降るらしい。)は「命題」と呼ばれる客観的な事柄を表す領域(例:今日は、雨が降る)と、「モダリティ」と呼ばれる話し手の命題に対する主観的認識や発話態度を表す領域(例:らしい。)から構成されており、モダリティは命題述部の語尾に現れる。SAGEにおいては、「モダリティ」を大きく、話しての命題に対する主観的認識を表す「判断のモダリティ」と発話態度を表す「発話のモダリティ」、命題実現の難易度を表す「程度のモダリティ」という3つのカテゴリに分けられている。 また、話し手の命題への主観的認識を表す判断のモダリティは、さらに二つのカテゴリに分かれ、命題を確かなものとして捉えるか不確かなものとして捉えるかといった「真偽判断のモダリティ」と、命題の実現を望ましいものとして捉える「価値判断のモダリティ」から構成される。SAGEにより得られたモダリティがアンケート記入者の意志を表していると考え、下図のようにモダリティの内特にアンケート者の意思を強く表している物を分類し8つの意志カテゴリ{ 要求・ 依頼・ 苦情・ 希望・ 意見・ 質問・ 迷い・勧誘 }とした。



STMの感情・意志分析機能

STMに追加した感情・意志分析機能では、文で表現されたアンケート者の意見をSAGE解析し、文節ごとに感情語辞書、慣用句辞書、顔文字辞書を照合してそこに登録された語意が含まれていれば、その語意に割り当てられた感情・意志カテゴリをその文節に付す。分析は下図のように、まず分析の前処理として分析対象の絞り込みを行い、分析対象のデータを作成し、次に分析方法を選択して実際に分析を行う。



感情・意志分析機能を実行すると下図のような画面が表示される。左のカテゴリから分析したい感情・意志カテゴリを選択し分析スタートボタンを押すと、選択された感情・意志に対して分析結果の欄に、ツリー形式でそれぞれの感情・意志を持つ文節を含む文の一覧が表示される。




ここで、分析結果内のツリーのノード(感情・意志カテゴリ上)を右クリックし、原文表示を選択することで下図のような画面が現れ、選択されているカテゴリが含まれている原文を表示させる。この画面では感情の起因となったテキストを、感情語(赤)、慣用句(青)、顔文字(緑)をそれぞれ色を変えて表示させることができ、どの文節に感情・意志カテゴリが付与されたかがわかる。<<この事例の説明を変更>>各カテゴリごとに、そのカテゴリが含まれる回答者のアンケートデータの原文を表示し、感情の起因となった語の色を変えることで、感情語を視覚的に判断できるようにした。感情語では「いつも褒められます。(喜)」、慣用句では「力を入れると折れそうなくらい細い(昂)」、顔文字では「ずーっとリピートしてます(^0^)/(喜)」というようにどの部分が感情の起因となる語かがはっきりとわかるようになった。  一方、「〜悪くない」という文などが(怒)ととれていたり、「〜評価は☆2です。」の☆の部分が顔文字としてとられ、(喜)の感情としてとられているなどの誤りも多くみられた。

   

グラフ表示ボタンを押すと下図のような各感情カテゴリごとにそれらのカテゴリを含む文節数<<分数か文節数か?>>の出現頻度をカウントしグラフとして表示できる。これによって視覚的に、どのような感情や意志が多く見られるかがわかる。また図3-29のような円グラフなどにすることもでき割合を表示できる。この事例では<<これ以降治す>>結果では喜の感情がもっとも多く、2番目には好の感情が多く見られている。このことから回答者の多くがこの製品に対し、良いイメージを持っていることがわかる。






意志についても下図のように、グラフ表示ボタンを押すことで各意志カテゴリごとにそれらのカテゴリを含む文節数の出現頻度をカウントしグラフとして表示する。




感情分析