Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

GPU使用率について #21

Open
lonemonkeywithwhiteshell opened this issue Nov 9, 2019 · 4 comments
Open

GPU使用率について #21

lonemonkeywithwhiteshell opened this issue Nov 9, 2019 · 4 comments

Comments

@lonemonkeywithwhiteshell

こんにちは。rtx2080tiで動作させたところ、GPU使用率が58%止まりになります。使用率を上げることはできますか?また、Averageが1650msくらいです。この速度は正常でしょうか?

@yssaya
Copy link
Collaborator

yssaya commented Nov 10, 2019

GPUの使用率は私の2080Tiで65%程度です。
使用率を上げるには
autousi.cfg を編集して
Device -1 # use a default device

Device 0 0
としていただくと、同一マシンで2つのaobazを使って棋譜を生成しようとして
2080Tiですと1.4倍ほど生成速度が上がります。
平均速度は1つのaobazで私の2080Tiだと平均1420ms程度ですので若干遅いかもしれません。

開発中のものでは棋譜の生成には使えませんが
$ git clone -b develop https://github.com/kobanium/aoba-zero.git aoba_develop
として取得してmakeし、
下のようなオプションで動かすとGPUをほぼ使いきり探索速度も3倍程度速くなります。
$ ./aobaz -p 30000 -i -t 10 -b 5 -u 0 -q -w ./weight/w765.txt
-t 10 はスレッド数が10で、-b 5 は内部でミニバッチサイズを5で計算する、という意味になります。
ただ同じplayout数ではシングルスレッドで計算した場合より+40Elo程度弱くなります。

@lonemonkeywithwhiteshell
Copy link
Author

lonemonkeywithwhiteshell commented Nov 10, 2019

Device 0 0 1 1 2 2 3 3 と設定して動かしてみました。2080tix4枚です。
GPU使用率は71%止まりでした。CPU使用率は81%、GPUクロックが1985MHzくらいです。。
やはりちょっと低いですがどこか工夫できますでしょうか?
+------+-----+--------+---< Aobaz Status >------------------------+
| PID | Dev | Average| Moves |
+------+-----+--------+-------------------------------------------+
| 12004| 0 | 3233ms| 1: |
| 10708| 0 | 3277ms|108:##################### |
| 4064| 1 | 3531ms| 41:######## |
| 6440| 1 | 3196ms| 17:### |
| 3648| 2 | 3209ms| 0: |
| 8584| 2 | 3127ms| 26:##### |
| 3652| 3 | 3622ms| 74:############## |
| 4616| 3 | 3637ms|150:############################## |
+------+-----+--------+-------------------------------------------+

  • Send Status: Sent 435, Lost 0, Waiting 0
  • Recv Status: Weights' ID 789, Last Check 11/10/19 18:00:58
  • 66.0 sent/hour, 1583.8 sent/day, Running for 6.6 hours(0.3 days).

@yssaya
Copy link
Collaborator

yssaya commented Nov 10, 2019

2080Ti x6 ではaobazを2つずつ割り当てて動かしていますが nvidia-smi で見る限りでは
個々のGPUの使用率は70%~92%ぐらいです。クロック数は不明です。
1枚に3つ割り当てればもう少し使用率は上がるかもしれませんが全体として速度が向上するかは
怪しいです。
Windowsで動かされている場合は、aobazeroの bin/ の下の OpenCL.dll を OpenCL_org.dll などと
名前を変更してGPUのドライバをインストール時に配布されるOpenCL.dllを使うように
すると速くなるかもしれません。
同じくOpenCLを使うLeelaZeroをLizzieで動かしているとタスクマネージャのGPU使用率は24%なのですが
nvidia-smi.exe で見ると97%ぐらいになるので、nvidia-smi.exe で使用率を見る方がいいかもしれません。

@lonemonkeywithwhiteshell
Copy link
Author

いろいろ有難うございます。やはり変化しないので、いったん諦めます。開発中のものに期待いたします。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants