目次 強化学習のネックポイントとなる点が探索の効率の悪さです。特にエージェント数が多くなると探索すべき空間が指数的に増加して、どんどん強化学習が難しくなります。 そんな探索の効率の悪さに対する対応策となるのが今回説明するMCTSです。 概要 MCTS(Monte Carlo Tree Search)は、木探索とモンテカルロシミュレーションを組み合わせた探索アルゴリズム です。 囲碁や将棋などのゲームAI(AlphaGo, AlphaZero, MuZero)で広く使われています。 1. MCTS の基本アイデア MCTS は、「将来の可能性を木構造で表現し、ランダムシミュレーションで評価する」…