講演情報

[6B-02]文章データを対象とした代表文抽出方式における重要度の時系列遷移による文章構成可視化方式

*小椋 佳歩1、岡田 龍太郎1、峰松 彩子1、中西 崇文1 (1. 武蔵野大学データサイエンス学部データサイエンス学科TransMedia Tech Lab)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり

キーワード:

テキストマイニング、文章構成の可視化、執筆者比較、動的時間伸縮法

本稿では文章データを対象とした代表文抽出方式における重要度の時系列遷移情報から文章構成を 可視化する方式を示す.一般に同一ジャンルであっても執筆者の意図によって文章全体のどの位置で重要なことを 記述するかは異なる.文章全体を一文単位に区切り各文同士の関連性を無向グラフとして表現し,グラフの中心性 の高さを文の代表度として抽出する.この代表度の遷移を文章構成の表現であるとして可視化する.さらにこの代 表度を動的時間伸縮法(DTW)を用いて比較することで執筆者と他の執筆者との文書構成の差異を軽量・可視化する. これにより執筆者個人の文章構成情報及び他者とどれほどの差があるかを把握することができる.本方式を用いる ことで執筆者がものを伝える際の考え方のクセを把握することを目指す.