Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

マルチスレッドのNUMA対応について #41

Open
bleu48 opened this issue Oct 24, 2020 · 4 comments
Open

マルチスレッドのNUMA対応について #41

bleu48 opened this issue Oct 24, 2020 · 4 comments

Comments

@bleu48
Copy link

bleu48 commented Oct 24, 2020

実用的な意味ではほぼジョークIssueです。(削除頂いて構いません)
手持ちの40コア80スレッドのマシンで1.5 cpu onlyバイナリで対戦させてみたところ
NUMAをまたぐCPUを使えていません。
CPUで100npsを超えてみたいのですが(笑)

棋譜生成は80スレッドに負荷が入りました。

@yssaya
Copy link
Collaborator

yssaya commented Oct 24, 2020

性能でませんでしたか・・・。
CPU版は12スレッドぐらいまでしか性能は調べていませんでした。
aobaz 単体だと96スレッドまでは一応動くはずですが。一度24コア48スレッドぐらいで調整してみます。
棋譜生成はautousiがプロセス(aobaz)をたくさん作るのでCPUを使いやすいのかもしれません。

@bleu48
Copy link
Author

bleu48 commented Oct 25, 2020

いえいえ,Windowsでは通常のままだとNUMAまたいでくれないんです。
2ソケットのXeonだと片方しか使ってくれませんでした。

@yssaya
Copy link
Collaborator

yssaya commented Oct 25, 2020

Linuxだと物理的に2枚CPUが載ったマシンだと16スレッドまでは伸びるようです。
ただしHTをOFFにしてあります。
Windowsの物理2枚CPUは持ってないので確認できないです。

スレッドの作成はこのあたりですが、何か必要な設定などありましたでしょうか?
https://github.com/kobanium/aobazero/blob/release/src/usi-engine/bona/ysszero.cpp#L861

CPU版の動作。E5-2687W 0 @ 3.10GHz (8コア 16スレッド)  x2 、ただしHTをOFF。Linux(CentOS)
スレッド数  nps
 1       6/s
 2      11/s
 4      23/s
 8      42/s
12      63/s
16      85/s

@bleu48
Copy link
Author

bleu48 commented Oct 25, 2020

時間が取れたときにこちらで対応を試してみます。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants