近年,インターネットの 普及により,膨大な数の文書が発信されており,有益 な情報を絞り込むことは容易ではない.そのため,所望する文書を効率的に探し 出すための,文書の内容に 基づいた知識整理を行う手法が必要であると考えら れる.知識整理を行う方法として,整理対象を代表するような短い言葉(タグ) を付与する方法が用 いられることが多い.近年では,このタグを文書に自動で 付与し,知識整理を行う手法が数多く報告されている.それらの中でも,トピッ クモデルを用 いた研究が近年注目され,また成果を挙げている.
上述のトピックモデルを用いた研究では,従来の自動タグ付け手法に対し,より 高い適合率と再現率でのタグ付けが可能であることが報告されている. しか し,既存の自動タグ付け手法では,単語やタグに対する時間変化を考慮しておら ず,時間とともに変化する話題のタグを付与することは困難となる と考えられる.
本研究では,文書に対す る自動タグ付けを目的として,文書に付与されるタグ と,文書に含まれているトピック,文書が生成された時間の3つに着目した新し いト ピックモデルの構築を行ってきた.本発表では,特定の時期に多く付与さ れる話題のタグが適切に付与されることを示す.