Presentation Information

[3J2-OS-15b-03]Bridging LLM-based planning and workflow languages for automated, validated, scalable exploration of scRNA-seq analyses

〇Yoshinori Hayakawa1, Haruka Ozaki1 (1. RIKEN)

Keywords:

exploratory data analysis,large language model based planning,validated workflows

生命科学における単一細胞RNAシーケンス(scRNA-seq)データ解析では、同一データセットに対して異なる目的や観点に基づく解析手法群を独立かつ並列に適用することで、多面的な生物学的知見が得られる。このようなデータ解析の自動化の試みとして、ワークフロー言語によるパイプライン化やLLMによる解析支援が提案されてきたが、多種類の解析の計画や結果の統合・解釈は依然としてユーザに委ねられていた。本研究では、同一データセットに対する複数の解析を計画・実行し、結果群を統合的に解釈する過程を再現性を保った形で自動化することを目的とした。具体的には、ユーザの研究要望に応じてLLMによって解析計画が生成、実行前に妥当性が検証され、入出力を持つモジュールから成るワークフローとして実装・実行される。得られた結果群は、研究要望に基づいて統合的に解釈され、レポートに要約される。提案手法を複数のデータセットとLLMを用いて評価したところ、妥当性検証により研究要望の充足率は平均で0.34から0.78へと大幅に向上するなど、探索的生命科学データ解析を検証可能かつスケーラブルに自動化できることが示された。

Comment

To browse or post comments, you must log in.Log in