強化学習の基礎理論と工学への応用を詳説
分布推定アルゴリズム。遺伝的アルゴリズムを改良した物です。個体の集合を交叉・突然変異させるのではなく、個体の生成確率を進化させます。最適化問題のアルゴリズムです。以下、自分へのメモです。わかったことが増えたら追記するかも。ビットストリング計算量に関しては、ビット数をn、反復数をTとしています。Population-Based Incremental Learning (PBIL) CiteSeer 続きを読む