氏名 : 相澤 靖之 (289933013)
所属 : 稲垣研
題目 : 同時通訳コーパスの構築
概要 :
自然言語処理の分野において、伝統的な手法では規則を
用いて自然言語を処理していた。しかしながら、元来自
然に発生し時代とともに変化してきた自然言語は、規則
に沿わない例外や、明確な規則が存在しない場合がある。
したがってすべてを規則を用いて扱うことは困難であっ
た。これに対して、コーパスを用いた処理を行う研究が
近年盛んに行われるようになっている。これらは、統計
的処理を行って言語現象を客観的に分析したり、コーパ
スをお手本として、それを真似することによって自然な
処理をしようとするもので、計算機の能力とコーパス整
備の進歩とともに成果をあげつつある。
われわれの研究室では計算機による同時通訳を目指した
種々の研究を行っている。しかしながら、現存するコー
パスの中に同時通訳処理研究への利用を前提としたもの
は少なく、同時通訳処理研究に適したコーパスが求めら
れている。そこでわれわれは現在CIAIR(名古屋大
学統合音響情報研究拠点)のプロジェクトの一環として、
同時通訳コーパスの作成を行っている。今回はこのコー
パスの概要と、これを利用した研究の見通しについて報
告する。
目次に戻る