講演情報
[3J2-OS-15b-03]scRNA-seqデータ解析の自動化に向けたLLMベース計画とワークフロー言語の統合:検証可能・スケーラブルな探索的解析の実現
〇早川 慶紀1、尾崎 遼1 (1. 理化学研究所)
キーワード:
探索的データ解析、大規模言語モデルによる計画生成、検証可能ワークフロー
生命科学における単一細胞RNAシーケンス(scRNA-seq)データ解析では、同一データセットに対して異なる目的や観点に基づく解析手法群を独立かつ並列に適用することで、多面的な生物学的知見が得られる。このようなデータ解析の自動化の試みとして、ワークフロー言語によるパイプライン化やLLMによる解析支援が提案されてきたが、多種類の解析の計画や結果の統合・解釈は依然としてユーザに委ねられていた。本研究では、同一データセットに対する複数の解析を計画・実行し、結果群を統合的に解釈する過程を再現性を保った形で自動化することを目的とした。具体的には、ユーザの研究要望に応じてLLMによって解析計画が生成、実行前に妥当性が検証され、入出力を持つモジュールから成るワークフローとして実装・実行される。得られた結果群は、研究要望に基づいて統合的に解釈され、レポートに要約される。提案手法を複数のデータセットとLLMを用いて評価したところ、妥当性検証により研究要望の充足率は平均で0.34から0.78へと大幅に向上するなど、探索的生命科学データ解析を検証可能かつスケーラブルに自動化できることが示された。
コメント
コメントの閲覧・投稿にはログインが必要です。ログイン
