[4D3-E-2-05]健診データを用いた生活習慣病の発症予測
〇恒川 充1、岡 夏樹1、荒木 雅弘1、新谷 元司2、吉川 昌孝3、谷川 武4(1. 京都工芸繊維大学、2. SGホールディングスグループ健康保険組合、3. 日本システム技術株式会社、4. 順天堂大学)
キーワード:
機械学習、クラスの不均衡、医療情報
本研究では,定期的な健診データを用いて生活習慣病の発症を予測する手法を提案する.レセプトデータを精査して疾病の発症を特定し,それらを教師あり学習のための正例として使用した.クラスバランスが不均衡なデータであるという問題に対処するために,アンダーサンプリングとバギングのアプローチを採用した.がん以外の生活習慣病が1年以内に発症するかどうかを予測することを目的とした.提案手法のprecisionとrecallはそれぞれ0.32と0.89であった.各検査項目に閾値を設定し,それらの論理和をとるというベースライン手法と比較して,提案手法はrecallを維持しながらより高いprecisionが得られることが分かった.これは,重症化しそうな対象者の見落としを増やすことなく,保健指導の対象者数を抑えることができるという点で意義がある.

