Presentation Information

[2I6-OS-7b-03]Deep generative model to disentangle batch effects and conditinal effects in the single-cell omics

〇Shunta Sakaguchi1, Masato Tsutsumi2,1, Kentaro Nishi3, Honda Naoki1,3 (1. Nagoya University, 2. University of Tsukuba, 3. Hiroshima University)

Keywords:

single-cell omics,variational autoencoder

1細胞オミクス解析では、大規模データに含まれるバッチ効果が大きな課題となっている。従来のバッチ補正手法は、バッチ間の差異を全て除去することでデータの統合を達成するため、同時に生物学的に重要なシグナルまで除去してしまい、条件間比較を困難にしていた。この最大の原因は、従来の手法がバッチ効果と、条件間の違いに依存する情報を明示的に分離していなかったことである。本研究では、変分オートエンコーダを用いた新しいバッチ補正手法 Kanade を提案する。Kanade は予測器を組み合わせて、潜在変数のサブセットをシグナルの種類ごとに割り当てることで、バッチ効果と生物学的シグナルを明確に分離する。この設計により、バッチ効果に割り当てられた潜在変数を選択的に補正することで、バッチ効果の効率的な補正を実現することができる。シミュレーションデータおよび実データへの適用により、条件依存的情報を保持したままバッチ効果を補正できることを示した。Kanade は条件間比較の精度を高めるとともに、直感的な設計により幅広い研究者が利用可能な手法である。