当研究室の特任助教 大澤先生の論文がICLR2018のWorkshopに 採択されました。
Workshop Invitation は全体の9%という難易度の高さは本会議(34%)と同様です。
おめでとうございます!
■技術について
従来のマルチエージェント強化学習では、報酬を各エージェントに分配する役割を担う「信頼できる第三者」(trusted third party)を必要とし、P2P, IoT, M2M など実社会における利用可能性が低いという問題が存在していました。
本論文の提案手法では、①エージェント間へ報酬分配および②オークション理論の導入により、信頼できる第三者の存在しない状況下で報酬分配を実現しました。提案手法の理論的な帰結として、各エージェントは他のエージェントによってもたらされる反実仮想収益(counterfactual return)の推定を行うことができます。
さらに、ニューラルネットを複数のニューロンから構成されるマルチエージェントシステム(Neuron as an Agent)として考えることで、ドロップコネクトを反実仮想収益にしたがって結合のマスクを行う点で拡張した適応的なドロップコネクト(Adaptive DropConnect)を提案しました。
世界的に有名なゲーム Doom を用いた実験では、既存手法を上回る精度を記録しました。
■デモ
https://www.youtube.com/watch?v=paT2n40QHOA&feature=youtu.be
■書誌情報
Shohei Ohsawa, Kei Akuzawa, Tatsuya Matsushima, Gustavo Bezerra, Yusuke Iwasawa, Hiroshi Kajino, Seiya Takenaka, Yutaka Matsuo: Neuron as an Agent , International Conference of Learning Representation (ICLR18) Workshop, 2018
■詳しくはこちらから
http://weblab.t.u-tokyo.ac.jp/our-paper-for-iclr2018-workshop-has-been-accepted-invitation/
■大澤先生の以前のインタビュー記事はこちらから
https://www.wantedly.com/companies/weblab/post_articles/102057