講演情報

[4Yin-A-22]日本語文法誤り訂正におけるナ形容詞の訂正:サブワード語彙サイズと表記の影響

〇米田 碧弥1、須藤 克仁1 (1. 奈良女子大学)

キーワード:

文法誤り訂正

日本語文法誤り訂正(GEC)は、独自の表記体系や語境界の曖昧さゆえに困難な課題である。特にナ形容詞は、語幹と接尾辞(「だ/な」)が分離して現れ、名詞との区別が曖昧になりがちなため、問題となりやすい性質がある。この難しさは、初級者に典型的なひらがな主体の文においてさらに増す。本研究では、Levenshtein Transformerを用い、「だ」や「な」の脱落・挿入といったナ形容詞の典型的誤りに対処した。サブワード語彙サイズ(16k対8k)と表記が訂正挙動に与える影響を分析した結果、「だ」の訂正は安定的である一方、「な」の訂正は語彙サイズや表記に敏感であり、細粒度分割がこうした局所的訂正に有効であることが示唆されました。