以前、過学習について確認しようとしていましたが、その前に学習率について確認します。これまでのところマイロ将棋では、最適化手法としてSGD(確率的勾配降下法)を使用しています。ディープラーニングでは、教師データを元にパラメータの調整を行いますが、調整の仕方としていろいろな方法が考えられています。SGD(確率的勾配降下法)は調整の仕方としては基本的な方法です。マイロもあまり詳しくは理解できていませんが、教師データとの誤差が大きいほど教師データに近づくように大きくパラメータを調整するという方法です。違っていたらすみません。他の最適化手法としては、モーメンタムSGD、ADAM、RMSProp等があり、…