DeepMindがarXiv上で発表した、深層強化学習のモデルを段階的な枝刈りすることでモデルサイズのスケーリングが可能になることを示した「In deep reinforcement learning, a pruned network is a good network」を読んだ際のメモ。 概要 深層強化学習はモデルサイズをスケーリングことは困難だった 段階的に枝刈りすることでスケーリングが可能であることを実証した 枝刈りすることでパフォーマンスも向上する 導入 深層強化学習では訓練中に多数のパラメータが休止状態になる 最近の研究でResNetバックボーンのDQNで段階的な枝刈りで元のパラメ…