Presentation Information

[2Yin-B-58]Evaluating Glyph Similarity across Writing Systems Using Machine LearningA Case Study of Chinese Ethnic Minority Scripts

〇Noritaka Kimura1 (1. Kokugakuin University)

Keywords:

Character Recognition,Similarity Measurement,Vision Transformer,Cosine Similarity

字形の比較を中心とする比較文字学研究は、学問の創始以来、初期段階にとどまっていると指摘されてきた。その主な要因として、字形の類似性に関する判断が主観的であり、漠然とした視覚的評価に依存してきた点が挙げられる。一方、近年ではMNISTなどのデータセットを用いた文字識別研究をはじめ、機械学習の導入により、文字画像の定量的分析が可能となっている。本研究では、これらの技術を応用し、文字の特徴量学習にとどまらず、文字間の字形類似性を定量的に測定する手法の構築を目的とする。特に個々の文字の比較に加え、文字体系全体に着目し、体系レベルでの類似性に基づく系統関係の検討を視野に入れた分析枠組みを提案する。具体的には、Vision Transformers(ViT)を用いて文字画像の特徴量を学習し、得られた埋め込みベクトル間のコサイン類似度により字形類似性を定量化する手法を採用する。中国少数民族文字を中心とした複数の文字体系を対象として実験を行った結果、本手法により算出された類似度は、実際に系統関係を有する文字体系間と比較して有意に低い値を示した。