質問応答

近年、自然文で書かれた質問文に対して膨大な量の文章より回答を抽出する質問応答システムの研究が盛んに行われています。質問応答システムは、ユーザが入力した質問文に対する回答を提示するので、膨大な量の文章を読む必要がなく要求した情報を容易に取得することができます。また、誤回答をしてしまっても得られた知識からユーザが自分で回答を判断することができるので、ユーザの文章を読む負担は遥かに少なくてすみます。


意味グラフ照合による質問応答システムMetis

質問応答システムMetisは、自然文で与えられた質問文に対し意味解析を行い、質問文と知識文(インターネットや新聞中の文で回答を含む可能性のある文)との意味的対応を十分正確に照合しながら回答を抽出します。

例えば、図1のように、質問文「ジョージ・ルーカスの出身大学はどこ?」を入力します。


質問応答システムMetisの概要

図1


入力された質問文から検索エンジンを呼び出すために、図2の@のようにキーワードを抽出し、Aのように検索文字列を作成して知識文検索を行うと、Bのように知識文が得られます。


質問応答システムMetisの概要

図2

クリックすると、拡大画像が新しいウィンドウに表示されます。


次に、入力された質問文を、図3の@のように意味解析を行い意味グラフに変換します。ここでは、文は文節を頂点、係り受けを辺にしたグラフで表現され、文節の主辞にはEDR辞書の語意が、辺には意味解析システムSAGEが定めた36種の深層格が割り当てられます。また、疑問詞(この場合は"どこ")を持つノードを「質問ノード」として、疑問詞に応じて疑問詞が持つ概念IDに加え概念IDを追加します(意味制約)。検索により得られた知識文も質問文と同様に、図3のAのように意味グラフに変換します。そして、意味グラフに変換した質問文と知識文を照合して、両グラフの共通部分グラフ(閾値以上の語意類似度を持つ頂点ペア(図3のB)とその間の閾値以上の格類似度を持つ辺ペア(図3のC))の大きさで文間の類似度(グラフ類似度)を判定します。


質問応答システムMetisの概要

図3

クリックすると、拡大画像が新しいウィンドウに表示されます。


最後に、グラフ照合において質問ノード "どこ" と照合している知識文のノード "南カリフォルニア大学の" を回答ノードとし、回答ノードを整形処理して "南カリフォルニア大学" と表示します(図4のA)。


質問応答システムMetisの概要

図4

クリックすると、拡大画像が新しいウィンドウに表示されます。


質問応答のテーマはコンテスト形式の評価型ワークショップが開かれており、NTCIR のQuestion Answering Challenge (QAC) やCross Language Question Answering (CLQA) 等の評価型ワークショップなどで研究成果が公表されています。現在、質問応答システムMetisではNTCIR-6 CLQAのFactoid質問200個に対してその190個に5位以内で正解を抽出し95%という高い回答精度を達成しています。
以下に、Metisによる質問応答の様子と正解を確認するための質問文と知識文の類似部分をビジュアル表示している様子をビデオで紹介します。


質問応答システムMetis