談話タグワーキンググループ設立趣意書

背景

統計を利用した音声処理や自然言語処理が成功するにつれて,より高精度な 処理を実現するために,文を越えた処理が必要であることが再認識され始め ている.ところが,従来の多くの処理機構(例えば,照応・省略処理,プラン 認識など)は,統計処理が対象とする大量のデータに対して,適用することが 難しいことが指摘されている.また,(音声)対話システムのような総合的な システムに関して,評価の重要性が認識されつつあるが,その方法論に ついては,検討の段階にある.

談話(対話)の性質を調べたり,処理をするためには,統語レベルのタグだけ でなく,意味レベルや談話レベルのタグが必要である.従来,各研究者それぞ れが作成したタグを基に議論が行われてきたが,タグの比較が難しいことや, データへのタグ付けの労力のため,相互に比較検討することによって、客観的 知見を確立することが困難であった.

上記の問題点をふまえて,欧米では,談話タグの標準化をすすめ,談話レベル の情報を付加した大規模なデータバンクを作成するための検討が開始されてい る.具体的には,NSFなどの資金援助によって,1996年3月を第1回とする非公 開の会合が実現し,標準化準備のための計画が進行しつつある.

日本においても,早稲田大学白井研究室,筑波大学板橋研究室,国立国語研究 所,千葉大学土屋研究室,ATR音声翻訳通信研究所等で,対話における発話間 の関係のタグの検討をすすめているが,それぞれ個別に行なっている.

目的と効果

日本における,音声および自然言語処理は,研究レベルは決して低いわけでは ないが,少数の例外を除き,多くのアイディアは,欧米の研究の後塵を拝する 結果になっている.本WGでは,欧米の談話の標準化と同時に,日本側において も,談話レベルのタグの標準化およびデータバンクの作成を行なっていくこと により,日本から音声・言語研究へのオリジナルな貢献を行なうための素地を 作ることを目的とする.

談話レベルのタグの標準化やタグを付与したデータバンクは,以下に示す研究 に利用することができる.

活動期間

平成8年度6月から2年間

活動内容


dtag-admin@slp.cs.ritsumei.ac.jp