講演情報
[2I6-OS-7b-03]1 細胞オミクス解析におけるバッチ効果と条件依存情報を分離する深層生成モデル
〇坂口 峻太1、堤 真人2,1、西 健太郎3、本田 直樹1,3 (1. 名古屋大学、2. 筑波大学、3. 広島大学)
キーワード:
1細胞オミクス、変分オートエンコーダー
1細胞オミクス解析では、大規模データに含まれるバッチ効果が大きな課題となっている。従来のバッチ補正手法は、バッチ間の差異を全て除去することでデータの統合を達成するため、同時に生物学的に重要なシグナルまで除去してしまい、条件間比較を困難にしていた。この最大の原因は、従来の手法がバッチ効果と、条件間の違いに依存する情報を明示的に分離していなかったことである。本研究では、変分オートエンコーダを用いた新しいバッチ補正手法 Kanade を提案する。Kanade は予測器を組み合わせて、潜在変数のサブセットをシグナルの種類ごとに割り当てることで、バッチ効果と生物学的シグナルを明確に分離する。この設計により、バッチ効果に割り当てられた潜在変数を選択的に補正することで、バッチ効果の効率的な補正を実現することができる。シミュレーションデータおよび実データへの適用により、条件依存的情報を保持したままバッチ効果を補正できることを示した。Kanade は条件間比較の精度を高めるとともに、直感的な設計により幅広い研究者が利用可能な手法である。
