We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
重みの更新を10000棋譜から34285棋譜に変更しました。 これはAlphaZeroが2400万棋譜、70万回学習、mini-batch=4096、1000回学習ごとに重み更新、なので 3.4285万棋譜(=2400/(700000/1000))に合わせたためです。
今までは1万棋譜ごとで直近の50万棋譜からサンプリング、なので50世代、 3.4285万棋譜だと15世代が含まれます。
mini-batch=128 だと32000回学習((4096/128)*1000)ごとに重み更新、なので 3.4285万棋譜で32000回学習になるように 1棋譜あたり1.07142回学習されるように 棋譜追加時の学習回数も調整しています。 今までは1棋譜あたり1回の学習でした。 1回で128局面を学習するので現在の平均手数85手だと1局面あたり1.41回ほど学習することになります。
The text was updated successfully, but these errors were encountered:
No branches or pull requests
重みの更新を10000棋譜から34285棋譜に変更しました。
これはAlphaZeroが2400万棋譜、70万回学習、mini-batch=4096、1000回学習ごとに重み更新、なので
3.4285万棋譜(=2400/(700000/1000))に合わせたためです。
今までは1万棋譜ごとで直近の50万棋譜からサンプリング、なので50世代、 3.4285万棋譜だと15世代が含まれます。
mini-batch=128 だと32000回学習((4096/128)*1000)ごとに重み更新、なので
3.4285万棋譜で32000回学習になるように 1棋譜あたり1.07142回学習されるように
棋譜追加時の学習回数も調整しています。
今までは1棋譜あたり1回の学習でした。
1回で128局面を学習するので現在の平均手数85手だと1局面あたり1.41回ほど学習することになります。
The text was updated successfully, but these errors were encountered: