講演情報

[8p-E217-9]YMnO₃単結晶を用いたインマテリオ物理リザバーコンピューティング素子による日本語音素認識

〇(M1)寺田 葵1、徐 木貞1,2、君塚 紘喜2、宇佐美 雄生1,2、田中 啓文1,2 (1.九工大生命、2.Neumorphセンター)

キーワード:

リザバーコンピューティング、機械学習

エッジAIの発展に伴い、時系列情報を実時間処理可能な小型ハードウェア基盤が求められている。本研究では、YMnO₃単結晶リザバーを物理リザバー素子として用い、日本語音声認識を行った[1]。音声入力は4チャネルのコクレアグラムに変換し、0–10 Vの電圧信号として1000 S/sで入力した。28電極から得られる応答をリザバー状態とし、従来手法ではワンホットベクトルへ写像した。さらに、時系列中の過渡的特徴を抽出するため、各時間出力を5区間に分割して平均化し、特徴次元を28次元から140次元へ拡張する分割型時間集約法を導入した。その結果、46音素分類精度は男性音声で28.04%から64.78%へ、女性音声で30.22%から49.78%へ向上した。これらの結果は、物理リザバーによる大規模分類では、材料固有の非線形性だけでなく、時系列情報の抽出・表現・前処理が認識性能を大きく左右することを示している。