チュートリアルセッション

第一線でご活躍の講師陣が基礎技術から応用事例までをわかりやすく解説いたします。


TS1
生成AIと3次元ビジョン
~3次元生成AIの最先端の理論~
6/12 (水)

講師:池畑 諭 氏
(国立情報学研究所/東京工業大学)

略歴2009年に東京大学で心理学の学士号を取得し、その後、同大学相澤清晴研究室にてフォトメトリックステレオの研究に従事し2011年と2014年に修士号と博士号を取得。2014年から2016年までは米国ワシントン大学セントルイス校でポスドク研究員として屋内環境の3次元復元の研究に従事。現在は国立情報学研究所の助教、東京工業大学の特任准教授、そして東京大学の客員研究員を兼務。主な興味は3次元センシングや3次元コンピュータビジョンであり、特にフォトメトリックステレオをはじめとする物理ベースビジョンや、深層学習を利用した3次元計測技術に携わっている。書籍コンピュータビジョン―広がる要素技術と応用― のフォトメトリックステレオの章を分筆。原島博学術奨励賞や電気通信普及財団テレコムシステム技術賞等の受賞歴を持つ。

 

概要:最近の3次元生成AIの発展は凄まじいものがあります。特にテキストや一枚の画像から完全な3次元モデルを生成する技術は、メタバース、ゲーム、映像制作の3Dアセット作成をサポートする重要な基盤技術となりつつあります。この講演では、2次元生成の知見を3次元生成へ拡張するための、損失関数や3次元表現の設計、生成結果が多視点での一致性を保つための工夫等についての最新の知見を解説し、3次元生成が現状どこまで実現できているのかについて議論します。

 
こんな方におすすめ
  • 3次元生成の理論的な話に興味がある方
  • 1枚の画像やテキストから3次元モデルを生成してみたい方

 


TS2
深層学習に潜むバイアス
~ビジョンと言語のタスクを中心に~
6/13 (木)

講師:中島 悠太 氏
(大阪大学データビリティフロンティア機構)

略歴2012年、大阪大学大学院工学研究科 博士後期課程修了。同年、奈良先端科学技術大学院大学情報科学研究科助教。2015年〜2016年、カーネギーメロン大学訪問研究員。2017年より現職 大阪大学データビリティフロンティア機構 准教授。コンピュータビジョン、パターン認識、自然言語処理、機械学習やその応用に関する研究に従事。

 

概要:深層学習がさまざまなアプリケーションで利用されるようになってきました。一方で、深層学習モデルは「偏見による決め付け」(バイアス)のような振る舞いをすることも明らかになってきました。特に人が関わるアプリケーションでは、社会的属性によるバイアスが大きな問題になります。本チュートリアルでは、なぜ深層学習モデルがバイアスを持つのか、またバイアスを低減するにはどうしたらいいかについて、ビジョンと言語に関するタスクを例に解説します。

 

こんな方におすすめ
  • なぜ深層学習モデルがバイアスを持つのか知りたい方
  • 深層学習のバイアスに対して何ができるのかを知りたい方
  • 深層学習を人が関わる問題に応用したい方

 


TS3
画像認識におけるマルチモーダル基盤モデル
~基盤モデル、あなたのタスクに役立つかも?~
6/14 (金) 

講師:齋藤 邦章 氏
(オムロンサイニックエックス株式会社)

略歴2018年東京大学情報理工学系研究科、原田・牛久研究室において修士号取得。博士課程では、2018年よりBoston Universityにおいて、Kate Saenko教授の元で、Domain Adaptation、Vision-Languageに関する研究を行う。Nvidia, Meta, Googleでのインターンを経験したのち、2023年に博士号取得。2023年6月より、OMRON SINIC Xにて、Senior ResearcherとしてVision-Languageの研究に従事。

 

概要:基盤モデルを活用した画像認識技術は、様々なタスクで注目を浴びています。このトレンドの背景には、画像だけでなく言語を学習に取り入れたマルチモーダル基盤モデルの存在があります。マルチモーダル基盤モデルは様々なタスクを解けるだけでなく、学習に用いることで、ダウンストリームタスクに用いる学習データではカバーできない知識をモデルに付与することができます。本講演では、マルチモーダル基盤モデルに注目しながら、画像認識に基盤モデルがどう活用できるのか解説します。

 

こんな方におすすめ
  • マルチモーダル基盤モデルについて知りたい方
  • 基盤モデルの応用先を知りたい方
  • どんなふうに基盤モデルを画像認識モデルの学習に活用すべきか知りたい方