Presentation Information
[4Yin-B-18]Analysis of Effective Features for Japanese Patent Inventor Disambiguation
〇Moriyuki Kamoto1, Nanako Ogiichi1, Koki Tajiri1, Marie Katsurai1 (1. Doshisha University)
Keywords:
Machine Learning,Name Disambiguation,Feature Analysis
特許発明者の名寄せでは,住所の近接性や共同発明者情報,技術分類といった特徴量を機械学習と組み合わせた手法が提案されてきた.しかし,各特徴量が名寄せ性能にどの程度寄与するかは十分に検証されていない.本研究では,研究者の希少氏名を利用して大量の教師データを自動生成し,7種類の特徴量に基づき特許発明者の名寄せモデルを構築した.各特徴量を個別に除外するアブレーションスタディにより,特徴量重要度の高さが必ずしも除去時の性能低下に対応しないこと,および特徴量間の代替可能性を明らかにした.本結果は,特許発明者の名寄せにおける特徴量選択に指針を与えるものである.
