セッション詳細
[OS2]オーガナイズドセッション2「マルチモーダル深層学習:画像認識を越えて広がる世界 ~画像・自然言語・音声の共創~」
2018年6月14日(木) 10:35 〜 12:05
メインホール アネックスホール2F
オーガナイザー:中山 英樹(東京大学)
深層学習の発達により、画像・言語・音声などさまざまな分野で驚異的な性能向上が実現されましたが、同時に各分野固有の技術の多くがニューラルネットワークという共通の枠組みに包含されるようになったことで、分野間の垣根が急速に低くなってきています。このような背景から、さまざまなモダリティを横断するマルチモーダルと呼ばれる領域の研究が進み、従来は考えられなかった魅力的な技術が次々と生まれています。本セッションでは、各分野の第一線で活躍されている講師をお招きし、マルチモーダル深層学習の基礎および最新の展開を解説し、議論を深めたいと思います。
[OS2-01]セッション全体説明
*中山 英樹1 (1. 東京大学)
[OS2-02]自然言語による状況理解
*岡崎 直観1 (1. 東京工業大学)
[OS2-03]テキスト・画像から音声への変換
*滝口 哲也1 (1. 神戸大学)
[OS2-04]モダリティ変換と画像生成
*加藤 大晴1 (1. 東京大学)
