自動要約

近年、インターネットの普及などによって膨大な量のテキスト情報が手に入るようになっています。その反面、必要な情報を的確に抽出することは困難となっています。また、携帯電話などの情報端末の普及に伴って情報をよりコンパクトにまとめる技術が必要となるなど、自動要約技術の必要性が高まっています。

自動要約システムABISYS

当研究室で開発している自動要約システムABISYSでは、文章に対し意味解析システムSAGEを用いて意味解析し、出力された解析結果に基づいて名詞節の中から重要語を抽出し、これを中心に要約文を生成します。


ABISYSでは報道記事、論説文、クレーム文の3つの種類を要約対象とします。

  • 報道記事
  • 出来事、事実、現象などを述べた現象文であり、主にニュースにあたる文章。

  • 論説文
  • 筆者の主張、意見、希望などを述べた文章であり、主に、社説、提案書などにあたる文章。

  • クレーム文
  • 顧客の要望、意見、不満などを述べた文章であり、会社に寄せられる苦情などにあたる文章。


    ABISYSの入力には 意味解析システムSAGEによって意味解析した結果である意味グラフを用います。

    意味解析を用いることで、表層的な情報からの語意ではなく、その文で用いられている真の語意や語と語の関係そのものを利用することができ、要約において重要な箇所を正しく抽出することが可能となります。下記の図の示すように、削除される部分が赤地に白文字として、要約結果が表示されます。

    評価実験として、他の7つのシステムと人間による要約結果を、10名の学生で「内容をカバーしている程度」と「読みやすさ」でランク付けした平均値を下表に示す。値が小さいほうが優れているわけで、ABISYSは人間の要約よりよく1位になっている。

    表1 ABISYSの評価



    図1 システム図


    図2 システム出力サンプル


    図3 解析結果サンプル


    Abisysによる新聞記事の要約の過程を以下のデモビデオに示す。


    Abisysデモ