氏名 : 川井 康示 (281167044)
所属 : 古橋研
題目 : 仕様書における曖昧語の抽出支援に関する研究
概要 :
仕様書を正確・明確に記述することは常に求められてきたことである.
しかし,大規模なプロジェクトでは,複数の担当者が仕様書を分担執筆することが多く,言葉の定義が不統一となり,曖昧語が発生する可能性がある.
曖昧語とは,表記は異なるが同じ意味として使われる語句や,逆に同じ表記の語句が複数の意味で用いられてしまう語句などのことであり,読み手は,そのような表記の曖昧性から,書き手の意図とは異なった解釈をしてしまう可能性がある.
そこで,本研究では,曖昧語の中でも,表記は異なるが同じ意味として使われる語句“同義語”に着目し,文書における同義語候補の検出支援を行う手法を提案する.
従来の同義語検出手法として,語句の文脈情報をベクトルとして表し,語句間の類似度をコサイン類似度などの類似度指標を用いて定量化を行うものがあるが,本研究では,それに対し複数の手法を取り入れることで,仕様書中からより適切に同義語候補が抽出可能であることを示す.
性能評価には,実際に公開されている仕様書において,特定の語句について,その半分を表記の異なる別の語句に置換することで人工的に正解同義語を作成し,提案手法の有効性を検討する.
目次に戻る