講演情報

[O4-4]インタラクティブな多検体ゲノムブラウザーの開発

笠原 雅弘, 横山 稔之 (東京大学 大学院新領域創成科学研究科 メディカル情報生命専攻)
【目的】DNAシークエンサーの技術革新により、ロングリードの塩基単価は大幅に下がり、PacBio Sequel II や Oxford Nanopore Technologies の PromethION などのロングリードを用いた多検体のヒトゲノム解析は一般的になりつつある。しかし、IGV や IGV.js、JBrowse2などの一般的なゲノムブラウザーは動作速度が遅く、100検体を超えるようなゲノムの解析においてインタラクティブにリードのアラインメントを表示し、探索的な解析をすることは実用的ではなかった。特にフェージングを行ったハプロタイプを表示する場合にはトラック数が2倍以上になるため動作の遅さが大きな問題となる。
【方法】 本研究では C, Rust 言語で実装された高速なアラインメントレンダリングエンジンHGBを開発し、スーパーコンピューターや大きなクラスター計算機などHPC環境を利用して並列レンダリングを行うことで100検体の表示時でも Google Map のような快適で高速なスクロールや描画を実現した。HGB は様々なフロントエンドから利用可能であるが、一例として JBrowse2 と連携するプラグインを開発した。
【結論】新しく開発したアラインメントレンダリングエンジン HGB を利用することにより、多検体やハプロタイプに対するインタラクティブなゲノム可視化解析が可能となった。トラック数の実用的な制限が大幅に緩和されているため、ハプロタイプフェージングを行った検体もハプロタイプ毎にアラインメントを実用的に表示・スクロールすることが可能となった。