講演情報
[4Yin-B-18]国内特許発明者の名寄せに有効な特徴量の検討
〇嘉本 名晋1、扇一 奈々子1、田尻 光輝1、桂井 麻里衣1 (1. 同志社大学)
キーワード:
機械学習、名寄せ、特徴量分析
特許発明者の名寄せでは,住所の近接性や共同発明者情報,技術分類といった特徴量を機械学習と組み合わせた手法が提案されてきた.しかし,各特徴量が名寄せ性能にどの程度寄与するかは十分に検証されていない.本研究では,研究者の希少氏名を利用して大量の教師データを自動生成し,7種類の特徴量に基づき特許発明者の名寄せモデルを構築した.各特徴量を個別に除外するアブレーションスタディにより,特徴量重要度の高さが必ずしも除去時の性能低下に対応しないこと,および特徴量間の代替可能性を明らかにした.本結果は,特許発明者の名寄せにおける特徴量選択に指針を与えるものである.
