講演情報
[PD2-8]機械学習を用いた直腸癌術後再発予測モデルの構築と評価
坂本 貴志1,2,3, 野口 竜剛1, 松井 信平1, 向井 俊貴1, 山口 智弘1, 秋吉 高志1, 福長 洋介1 (1.がん研有明病院, 2.国際医療福祉大学, 3.東京大学大学院医学系研究科医療品質評価学)
【背景】
進行直腸癌は局所または遠隔転移再発が20~30%程度の割合で発生し,再発の予測は重要な課題である.近年,消化器外科領域では機械学習を用いた予測モデルの研究が散見され,その導入による高度な予測能力のモデル構築が期待されている.本研究では日常臨床で収集可能なデータを用いて,直腸癌術後再発を予測するモデルの構築を目指した.
【方法】
2010年から2018年にかけて,当院で手術を受けた直腸癌患者のうち,同時性遠隔転移例,非根治切除例,観察期間が36ヶ月未満の例を除外し,XGBoost,Lasso回帰を用いて術後再発予測モデルを構築した.モデルには性別,年齢,術前治療(放射線,化学療法),術前腫瘍マーカー(CEA,CA-19-9),腫瘍部位,腫瘍肛門縁距離,術式,病理所見(腫瘍深達度,リンパ節転移,リンパ管侵襲,静脈侵襲)などの変数を投入した.Lasso回帰では欠損値を多重代入法で補完した.予測能力の評価にはAUROCを用い,Delong検定で参照モデルである術後病理所見(TおよびN stage)を変数としたLogistic回帰モデルと比較した.
【結果】
対象となった1950人の患者の中央年齢は62歳で,男性が59.3%であった.術前化学療法を受けた患者は9.1%,術前化学放射線療法を受けた患者は26.6%であった.腫瘍部位はP/Rb/Ra/Rs=1.7/46.3/27.8/24.2%であった.腫瘍肛門縁距離が4cm以上は42.1%,4cm未満は17.7%,不明は40.3%であった.術式は直腸切断術(12.2%),括約筋間切除術(11.8%),超低位前方切除術(26.6%),低位前方切除術(27.4%),高位前方切除術(17.3%),その他(4.1%)であった.病理所見ではT3またはT4が46.4%,N陽性が33.4%で,静脈侵襲が63.8%,リンパ管侵襲が45.1%であった.術後再発は15.5%に認められた.XGBoostのAUROCは0.83(95% CI:0.80-0.85),Lasso回帰のAUROCは0.79(95% CI:0.76-0.81)であり,参照モデルであるLogistic回帰のAUROC(0.74,95% CI:0.72-0.77)よりも有意に優れていた(p<0.001,p=0.028).
【結論】
XGBoostやLasso回帰を用いた直腸癌術後再発予測モデルの識別能は,術後病理所見(TおよびN stage)を変数としたLogistic回帰モデルよりも有意に優れていた.
進行直腸癌は局所または遠隔転移再発が20~30%程度の割合で発生し,再発の予測は重要な課題である.近年,消化器外科領域では機械学習を用いた予測モデルの研究が散見され,その導入による高度な予測能力のモデル構築が期待されている.本研究では日常臨床で収集可能なデータを用いて,直腸癌術後再発を予測するモデルの構築を目指した.
【方法】
2010年から2018年にかけて,当院で手術を受けた直腸癌患者のうち,同時性遠隔転移例,非根治切除例,観察期間が36ヶ月未満の例を除外し,XGBoost,Lasso回帰を用いて術後再発予測モデルを構築した.モデルには性別,年齢,術前治療(放射線,化学療法),術前腫瘍マーカー(CEA,CA-19-9),腫瘍部位,腫瘍肛門縁距離,術式,病理所見(腫瘍深達度,リンパ節転移,リンパ管侵襲,静脈侵襲)などの変数を投入した.Lasso回帰では欠損値を多重代入法で補完した.予測能力の評価にはAUROCを用い,Delong検定で参照モデルである術後病理所見(TおよびN stage)を変数としたLogistic回帰モデルと比較した.
【結果】
対象となった1950人の患者の中央年齢は62歳で,男性が59.3%であった.術前化学療法を受けた患者は9.1%,術前化学放射線療法を受けた患者は26.6%であった.腫瘍部位はP/Rb/Ra/Rs=1.7/46.3/27.8/24.2%であった.腫瘍肛門縁距離が4cm以上は42.1%,4cm未満は17.7%,不明は40.3%であった.術式は直腸切断術(12.2%),括約筋間切除術(11.8%),超低位前方切除術(26.6%),低位前方切除術(27.4%),高位前方切除術(17.3%),その他(4.1%)であった.病理所見ではT3またはT4が46.4%,N陽性が33.4%で,静脈侵襲が63.8%,リンパ管侵襲が45.1%であった.術後再発は15.5%に認められた.XGBoostのAUROCは0.83(95% CI:0.80-0.85),Lasso回帰のAUROCは0.79(95% CI:0.76-0.81)であり,参照モデルであるLogistic回帰のAUROC(0.74,95% CI:0.72-0.77)よりも有意に優れていた(p<0.001,p=0.028).
【結論】
XGBoostやLasso回帰を用いた直腸癌術後再発予測モデルの識別能は,術後病理所見(TおよびN stage)を変数としたLogistic回帰モデルよりも有意に優れていた.