GPUPIベンチマーク回してみた

http://pc.watch.impress.co.jp/docs/news/yajiuma/20141205_679028.html

オーストリアのオーバークロッカー向けサイト「overclockers.at」にて、GPUの並列演算を利用した円周率計算ベンチマークソフト「GPUPI Beta 1.3」が公開されている。


面白そうなの見つけたので回してみた

ワイの使用GPUはご存知、GeForce GTX Titan X@4個
空冷でOCは無し。つまりデフォ

CUDA 7.0.5 is ready. Timer: HPET (14.32 MHz)

CUDA GPU: GeForce GTX TITAN X #1
Kernel 1, Batch Size: 1M, Blocks: 1024, Threads: 1024
Kernel 2, Batch Size: 1M, Blocks: 1366, Threads: 768

CUDA GPU: GeForce GTX TITAN X #2
Kernel 1, Batch Size: 1M, Blocks: 1024, Threads: 1024
Kernel 2, Batch Size: 1M, Blocks: 1366, Threads: 768

CUDA GPU: GeForce GTX TITAN X #3
Kernel 1, Batch Size: 1M, Blocks: 1024, Threads: 1024
Kernel 2, Batch Size: 1M, Blocks: 1366, Threads: 768

CUDA GPU: GeForce GTX TITAN X #4
Kernel 1, Batch Size: 1M, Blocks: 1024, Threads: 1024
Kernel 2, Batch Size: 1M, Blocks: 1366, Threads: 768

Calculating 1.000.000th digit of PI. 4 iterations.

Allocated device memory : 67145792 Bytes
Batch Size : 1M
Reduction Size : 64

00h 00m 00.000s Batch 4 finished.
00h 00m 00.007s PI value output -> 6C65E52CB

Statistics

GeForce GTX TITAN X #1 calculated 25.0% (0.003s + 0.001s)
GeForce GTX TITAN X #2 calculated 25.0% (0.003s + 0.001s)
GeForce GTX TITAN X #3 calculated 25.0% (0.003s + 0.001s)
GeForce GTX TITAN X #4 calculated 25.0% (0.003s + 0.001s)


100万桁だと0.007病の模様
GeForce GT 640でもわずか0.086秒で終了するらしいけど、Titan X4連でもこんなもんか?
もっとデカい桁でないと差が出ないのかなぁ。後で320億桁も試してみる

ちなみにOpenCLのが遅いのでCUDAでやってるで



お前らも回してみるとええで
320億桁でな!

GTX 980でも50分かかるらしいけど・・・。1個でそれなんだろうか?
スポンサーサイト
[PR]

Comment

Comment Form

管理者にだけ表示を許可する

Trackback


この記事にトラックバックする(FC2ブログユーザー)

  1. 無料アクセス解析