近年,Web の発展と共に,ニュース記事やブログ記事,SNS におけるユーザの投稿など,時系列的な文書が大量に生成されるようになった.これに伴い,これら時系列文書中のトピックの時間発展の解析を目的として,これまで様々な時系列トピックモデルが提案されている.トピックモデルとは,bag-of-words表現された文書の生成過程を確率的にモデル化した言語モデルである.また,時系列トピックモデルとは,トピックの時間発展を考慮できるようにトピックにマルコフ性を仮定したトピックモデルである.既存のモデルの多くは,各トピックが独立に発展していくと仮定している.しかし,実際には各トピックは互いに依存し合いながら発展していくため,既存のモデルでは時系列文書を十分にモデル化できていないと考えられる.
本研究では,時系列文書の適切なモデル化を目的として,複数のトピックが互いに依存し合いながら,時間と共に発展していくことを仮定した新しい時系列トピックモデルを提案し,その構築を行ってきた.本発表では,実際のニュース記事を用いた実験により,提案モデルが既存のモデルよりも適切に時系列文書をモデル化できることを示す.