競技プログラミング界隈では一般教養であるらしいセグメント木のSum-tree構造で高速な重み付きサンプリングを実装します。 はじめに A. numpy.choiceによる重み付きランダムサンプリング B. 累積和による重み付きランダムサンプリング C. Sum-tree構造を活用した重み付きランダムサンプリング Sum-TreeのPython実装 速度パフォーマンスの確認 おわりに はじめに 強化学習の重要手法である優先度付き経験再生(Prioritized Experience Replay)では、重みづけされた100万の経験(遷移情報)からランダムにサンプリングしてミニバッチを作成する、と…