Presentation Information

[8p-E217-9]Japanese Phoneme Recognition using a YMnO3 Single Crystal-based In-Materio Physical Reservoir Computing Device

〇(M1)Aoi Terada1, Muzhen Xu1,2, Koki Kimizuka2, Yuki Usami1,2, Hirofumi Tanaka1,2 (1.Kyushu Inst., 2.Neumorph center.)

Keywords:

reservoir computing,machine learning

エッジAIの発展に伴い、時系列情報を実時間処理可能な小型ハードウェア基盤が求められている。本研究では、YMnO₃単結晶リザバーを物理リザバー素子として用い、日本語音声認識を行った[1]。音声入力は4チャネルのコクレアグラムに変換し、0–10 Vの電圧信号として1000 S/sで入力した。28電極から得られる応答をリザバー状態とし、従来手法ではワンホットベクトルへ写像した。さらに、時系列中の過渡的特徴を抽出するため、各時間出力を5区間に分割して平均化し、特徴次元を28次元から140次元へ拡張する分割型時間集約法を導入した。その結果、46音素分類精度は男性音声で28.04%から64.78%へ、女性音声で30.22%から49.78%へ向上した。これらの結果は、物理リザバーによる大規模分類では、材料固有の非線形性だけでなく、時系列情報の抽出・表現・前処理が認識性能を大きく左右することを示している。