談話・対話研究におけるコーパス利用研究グループ設立趣意書

目的

日本の人工知能研究における談話・対話研究を発展させるために,言語学, 認知科学と協力しながら学際的なアプローチに基づき,日本語の大量の音声, 言語データ(コーパス)を有効に利用して,日本語における(音声)言語使用の あり方,音声対話および自然言語処理システムのための規則の学習機構や 評価方法を明らかにすることを目的とする.

背景

計算機の性能が飛躍的な進歩をとげることにより,人工知能研究(音声処理や 自然言語処理)だけでなく,他の分野でも大量の音声,言語データを蓄積し, 理論の検証に利用することが検討され始めている.また,音声処理や自然言語 処理においては,システムの処理精度を向上させるため,音声,言語コーパス に対して適用できるような言語学,認知科学の知見を求められている. このような目的を実現するために,生のデータをそのまま利用するのでは なく,データに対してタグを付加する必要性があることが認識されている.

データに対してタグを付加するには,コストがかかるため,複数の研究機関が 協力して作業できるのが望ましい.このような背景のもと,欧米では談話タグの 標準化の検討が進められている(1996年3月,1997年2月と標準化の会合が開かれ, 標準化案が作成されている).この動きに合わせて,日本においても,8大学4研究 機関 ( 大阪大学・溝口研究室,京都大学・堂下研究室,千葉大学・市川研究室,土屋研究室, 筑波大学・板橋研究室,電気通信大学・榑松研究室,豊橋技術科学大学・中川研究室, 奈良先端科学技術大学院大学・松本研究室,早稲田大学・白井研究室,ATR音声翻訳 通信研究所,国立国語研究所,電子技術総合研究所,日本電信電話株式会社基礎研究所 )から成る談話タグワーキンググループ が,人工知能学会・音声理解と対話 処理研究会の中に1996年6月より2年間の予定で設立された.このワーキンググループ では,日本語に関する談話タグの標準化について検討が進められており,1998年5月 には,その標準化案が提出される予定になっている.

活動内容

複数の研究機関が協力して作成した談話情報(タグ)セットをそれぞれの機関の 持つコーパスに対して付与し,このコーパスに対して,韻律,統語意味情報と 談話情報や談話情報間の相関を明らかにする.また,そのコーパスを利用して, 既存の音声対話システム(のモジュール)や自然言語システム(のモジュール)の 評価を行なう.このような実際の作業の前提となる,コーパスへのタグ付与を より安定したものにするために,既にタグ付与されたデータをデータベース化 し,容易に検索できる仕組みを準備する.

活動期間

平成10年度6月から3年間

期待される成果


dtag-admin@slp.cs.ritsumei.ac.jp