講演情報
[T8-O-3]ボーリングデータの地層対比処理の自動化に向けた機械学習アルゴリズムの検討
*野々垣 進1、根本 達也2 (1. 産総研 地質調査総合センター、2. 大阪公立大学)
キーワード:
機械学習、ボーリングデータ、地層対比、特徴量、アルゴリズム
地盤リスク評価や地震ハザードマップ作成等の実施には,地下浅部における地層の詳細な分布形態の情報が不可欠である.一般に踏査による露頭観察が困難な都市域の地下浅部地質構造解析では,地下の状況を直接観察できるボーリング掘削調査の結果(ボーリングデータ)に対して地層の対比を行い,その結果に基づいて3次元地質モデルを作成する(納谷ほか,2021など).このため,いかに多くのボーリングデータについて正確な地層対比を行えるかが,都市域の浅部地質構造解析では重要となる.本研究では,国や自治体から機械可読な形式(国交省,2016)で大量に公開されているボーリングデータに対して,迅速かつ安定した精度で地層対比を行う技術の開発を目的として,ボーリングデータに記録される地盤の特徴量から機械学習を利用して地層対比を行う手法について検討している.本発表では,その一環として実施した地盤の特徴量を効果的に利用できる機械学習アルゴリズムの検討結果について紹介する.
ここではボーリングデータの地層対比処理を,地盤の特徴量を入力データ,地層名ラベルを出力データとする教師あり学習の分類問題と考える.地盤の特徴量を効果的に利用できる機械学習アルゴリズムの検討では,まず野々垣ほか(2023)をベースに利用する特徴量を決定した.具体的には,野々垣ほか(2023)で検討された標高,岩石・土質,標準貫入試験結果(N値),色調という4種類の特徴量に加えて,ボーリング掘削地点の緯度・経度,および各岩石・土質の厚さを利用することとした.次に,異なる機械学習アルゴリズムに基づいて,地盤の特徴量から地層名を予測する地層対比モデルを作成し,それらの性能を比較した.地層対比モデルを作るためのテストデータには,納谷ほか(2018)で利用された千葉市周辺のボーリングデータとその地層対比結果を用いた.ただし,全ボーリングデータ1,654本のうち,1,300本を学習用データ,残りの354本を評価用データに割り当てた.機械学習アルゴリズムには,k近傍法,サポートベクターマシン,決定木(ランダムフォレスト,LightGBM,XGboost),独自のニューラルネットワーク(畳み込み層なし・あり)を用いた.地層対比モデルの性能評価には,正解率(Accuracy),適合率(Precision),再現率(Recall),特異率(Specificity),F1スコア(F1score)などの数値指標を用いた.
テストデータが取得された地域の地下浅部には,下位より清川層,木下層,沖積層,人口地層の4層が分布する.ここでは各機械学習アルゴリズムに基づいて,ボーリングデータの各部位が上記4層のどれに該当するのかを予測する地層対比モデルを作成し,各モデルの性能を比較した.その結果,LightGBM,XGboost,ニューラルネットワーク(畳み込み層あり)による地層対比モデルが特に高い対比性能を示した.例えば,正解率(Accuracy)では,LightGBM(93.8%),XGboost(93.9%),ニューラルネットワーク(畳み込み層あり)(94.2%)となっており,野々垣ほか(2023)で示された最高正解率88.3%を大きく上回った.正解率が上昇した理由としては,本検討で設定した機械学習アルゴリズムの方が野々垣ほか(2023)の用いたものよりも効果的に特徴量を利用できるものであったことや,入力する地盤の特徴量に緯度・経度を加えたことにより地層の側方変化が考慮されるようになったこと等が考えられる.また地層ごとの予測性能に着目すると,すべての対比モデルで木下層に対する適合率(Precision)および再現率(Recall)が他の地層に対するものと比べて低くなった.沖積層と誤対比するケースが多くみられ,この点については改善の余地が残った.
本研究では地盤の特徴量を固定したうえで,それらの特徴量を効果的に利用できる機械学習アルゴリズムについて検討した.今後は各アルゴリズムについて,どのような特徴量の場合に誤対比となるのかを精査し,さらなる対比精度の向上を目指す.本研究はJSPS科研費22K03745の助成を受けたものである.
文献
国土交通省,2016,地質・土質調査成果電子納品要領.国土交通省,50p.
納谷ほか,2018,都市域の地質地盤図「千葉県北部地域」説明書.産総研地質調査総合センター,55p.
納谷ほか,2021,都市域の地質地盤図「東京都区部」説明書.産総研地質調査総合センター,82p.
野々垣ほか,2023,機械学習によるボーリングデータの地層対比に有効な地盤の特徴量の検討,日本地質学会第130年学術大会講演要旨.
ここではボーリングデータの地層対比処理を,地盤の特徴量を入力データ,地層名ラベルを出力データとする教師あり学習の分類問題と考える.地盤の特徴量を効果的に利用できる機械学習アルゴリズムの検討では,まず野々垣ほか(2023)をベースに利用する特徴量を決定した.具体的には,野々垣ほか(2023)で検討された標高,岩石・土質,標準貫入試験結果(N値),色調という4種類の特徴量に加えて,ボーリング掘削地点の緯度・経度,および各岩石・土質の厚さを利用することとした.次に,異なる機械学習アルゴリズムに基づいて,地盤の特徴量から地層名を予測する地層対比モデルを作成し,それらの性能を比較した.地層対比モデルを作るためのテストデータには,納谷ほか(2018)で利用された千葉市周辺のボーリングデータとその地層対比結果を用いた.ただし,全ボーリングデータ1,654本のうち,1,300本を学習用データ,残りの354本を評価用データに割り当てた.機械学習アルゴリズムには,k近傍法,サポートベクターマシン,決定木(ランダムフォレスト,LightGBM,XGboost),独自のニューラルネットワーク(畳み込み層なし・あり)を用いた.地層対比モデルの性能評価には,正解率(Accuracy),適合率(Precision),再現率(Recall),特異率(Specificity),F1スコア(F1score)などの数値指標を用いた.
テストデータが取得された地域の地下浅部には,下位より清川層,木下層,沖積層,人口地層の4層が分布する.ここでは各機械学習アルゴリズムに基づいて,ボーリングデータの各部位が上記4層のどれに該当するのかを予測する地層対比モデルを作成し,各モデルの性能を比較した.その結果,LightGBM,XGboost,ニューラルネットワーク(畳み込み層あり)による地層対比モデルが特に高い対比性能を示した.例えば,正解率(Accuracy)では,LightGBM(93.8%),XGboost(93.9%),ニューラルネットワーク(畳み込み層あり)(94.2%)となっており,野々垣ほか(2023)で示された最高正解率88.3%を大きく上回った.正解率が上昇した理由としては,本検討で設定した機械学習アルゴリズムの方が野々垣ほか(2023)の用いたものよりも効果的に特徴量を利用できるものであったことや,入力する地盤の特徴量に緯度・経度を加えたことにより地層の側方変化が考慮されるようになったこと等が考えられる.また地層ごとの予測性能に着目すると,すべての対比モデルで木下層に対する適合率(Precision)および再現率(Recall)が他の地層に対するものと比べて低くなった.沖積層と誤対比するケースが多くみられ,この点については改善の余地が残った.
本研究では地盤の特徴量を固定したうえで,それらの特徴量を効果的に利用できる機械学習アルゴリズムについて検討した.今後は各アルゴリズムについて,どのような特徴量の場合に誤対比となるのかを精査し,さらなる対比精度の向上を目指す.本研究はJSPS科研費22K03745の助成を受けたものである.
文献
国土交通省,2016,地質・土質調査成果電子納品要領.国土交通省,50p.
納谷ほか,2018,都市域の地質地盤図「千葉県北部地域」説明書.産総研地質調査総合センター,55p.
納谷ほか,2021,都市域の地質地盤図「東京都区部」説明書.産総研地質調査総合センター,82p.
野々垣ほか,2023,機械学習によるボーリングデータの地層対比に有効な地盤の特徴量の検討,日本地質学会第130年学術大会講演要旨.
コメント
コメントの閲覧・投稿にはログインが必要です。ログイン