大倉 龍介
深層強化学習を用いた危険度予測
東京大学が主催する寄付講座「世界モデルと知能」に参加し、深層強化学習を実装した。この講座は深層学習について深く学び、世界モデルと呼ばれる深層学習を実装することを目標としている。私は、最終課題として5人のチームを組み、Duckietownと呼ばれる環境において車両を走行させ、フロントカメラからの観測及びDreamerによる再構成によって障害物の危険度を予測することを実装した。もともとは別のタスクに取り組んでいたが不備があり急遽このタスクに取り組んだため約3週間で結果を出さなければならず非常に苦労した。