自ら成長し、どんどん賢くなる制御AI「Smart MPC」を開発。強化学習より数百倍高速だから実機でも学習可能に。

編集

1120 views

ABOUT

この動画はSmart MPCを用いた倒立振子の制御の様子です。強化学習(DQN)では数百エピソードを必要としますがSmart MPCなら一桁エピソードで収束します。

【背景】
現在多くのプラントや機械の制御にはPID制御と呼ばれる方法が使われています。PIDは比較的直観的で現場の作業者にとっても調整が可能である一方で、いくつかの欠点を持ちます。
・むだ時間に弱くオーバーシュートやハンチングが起きやすい
・SISO（一入力一出力）系しか扱えない
・拘束条件が扱えない
・最適化できない
これらはものによっては致命的な問題で、制御システムの開発を著しく難しており、PIDのパラメータの調整だけでも多くの時間を浪費してしまうといった状況が各所で見られます。

一方で、強化学習はAlphaGoやDQN(Deep Q-Network)などに代表されるように、一部では人間の能力を超えた成績を出せるようになってきてはいますが、その学習には膨大なデータが必要であり、学習自体も非常に不安定で再現性に乏しく、少なくとも現時点では産業利用にはとても向かないといった欠点をもっています。

弊社が開発したSmart MPC (Model Predictive Control)はモデル予測制御と呼ばれる制御法と機械学習を組み合わせることにより、上記の2つの手法の欠点をすべて解決することが出来ました。

【Smart MPCの特徴】
1. むだ時間に強い
未来の状態（予測）に基づいた適切なフィードバック制御ができます。

2. 学習が早く、安定している
少数データでも学習が可能であり、学習結果も安定しています。
学習も簡単で、パラメータの調整の手間も非常に少ないです。

3. 計算量が小さい
制御対象によってはRaspberry PiのCPUでも動くほど軽量です。

〈その他3つの特徴〉
・ MIMO（多入力多出力）系が扱える
・拘束条件が扱える
・最適化ができる

詳細は以下のURLより
https://proxima-ai-tech.com/tech_smartmpc