CUDAを利用したPIV解析の高速化

1. CUDAを利用したPIV解析の高速化に関する研究指導教員熱工学研究室二宮尚史翔新

2. CUDAを利用したPIV解析の高速化に関する研究指導教員熱工学研究室二宮尚史翔新

3. PIV

4. Particle Image Velocimetry 粒子画像流速測定法

9. 時刻 t 時刻 t+Δt

12. 時刻t

13. 時刻t

14. 時刻t 時刻t+Δt

20. 時刻t

27. PIV解析はベクトルが多い

28. PIV解析はベクトルが多い • 画像サイズは1024×1024

29. PIV解析はベクトルが多い • 画像サイズは1024×1024 • 検査領域サイズは8×8から48×48

30. PIV解析はベクトルが多い • 画像サイズは1024×1024 • 検査領域サイズは8×8から48×48 • オーバーラップは50%が平均的

31. PIV解析はベクトルが多い一回の解析で数千∼数万のベクトル

34. 同時演算

35. 同時演算に優れたデバイス？

37. GPU Graphics Processing Unit 画像演算装置

38. GPU Graphics Processing Unit 画像演算装置

39. GPGPU General Purpose Graphics Processing Unit 汎用目的画像演算装置

40. SM数 SP数名前（CPU数相当）（コア数相当） GeForce GT 12 96 240 GeForce GTX 48 384 560 Ti GeForce GTX 168 1,344 660 Ti 主流のグラフィックボードスペック

41. スパコン単一CPU 単一GPU 演算能力 ◎ ⃝ △ 単一スレッド ◎ ◎ ⃝ 演算速度マルチスレッド ◎ △ ⃝ 演算速度運用コスト ☓ ⃝ ⃝

44. GPGPU

45. CPU GPGPU

46. CPU C、Java、Ruby… GPGPU

47. CPU C、Java、Ruby… GPGPU 言語？

49. • CUDA

50. • CUDA • ATI Stream

51. • CUDA • ATI Stream • OpenCL

52. CUDA ATI Stream OpenCL 対応デバイス △ △ ⃝ 性能 ◎ ◎ ⃝ サポート ◎ △ ⃝

57. CUDA

58. C言語コード CUDAコード

59. C言語コード CUDAコード #include <stdio.h> int main() { ! int n, *a; ! n = 100; ! a = (int *)malloc(n); ! ! func(a, n); ! ! return 0; } void func(int *a, int n) { ! int i; ! for (i = 0; i < n; i++) { ! ! a[i] = i; ! } }

60. C言語コード CUDAコード #include <stdio.h> #include <stdio.h> int main() { int main() { ! int n, *a; ! int n, *cpu_a, *gpu_a; ! n = 100; ! n = 100; ! a = (int *)malloc(n); ! cpu_a = (int *)malloc(n); ! cudaMalloc((void **)&gpu_a, n); ! ! ! func(a, n); ! func<<<3, 32>>>(gpu_a, n); ! cudaMemcpy(cpu_a, gpu_a, n, cudaMemcpyDeviceToHost); ! ! ! return 0; ! return 0; } } void func(int *a, int n) { __global__ void func(int *a, int n) { ! int i; ! int i; ! i = blockIdx.x * blockDim.x + threadIdx.x; ! ! for (i = 0; i < n; i++) { ! if (i < n) { ! ! a[i] = i; ! ! a[i] = i; ! } ! } } }

68. PIV解析実行時間比較 90 sec 60 sec 30 sec i:24; w: 24 i:32; w:32 i:48; w:48 i: 16; w: 16

69. PIV解析実行時間比較 90 sec C言語（Intel Core 2 Duo P8400 2.26GHz） 60 sec 30 sec i:24; w: 24 i:32; w:32 i:48; w:48 i: 16; w: 16

70. PIV解析実行時間比較 90 sec C言語（Intel Core 2 Duo P8400 2.26GHz） 60 sec 30 sec C言語（Intel Core i5 2400s 2.5GHz） i:24; w: 24 i:32; w:32 i:48; w:48 i: 16; w: 16

71. PIV解析実行時間比較 90 sec C言語（Intel Core 2 Duo P8400 2.26GHz） 60 sec 30 sec C言語（Intel Core i5 2400s 2.5GHz） CUDA（Nvidia GeForce GTX 560 Ti） i:24; w: 24 i:32; w:32 i:48; w:48 i: 16; w: 16

72. 倍以上の速さ ※Core i5の実行速度より

73. 3 倍以上の速さ ※Core i5の実行速度より

74. 3 倍以上の速さ ※Core i5の実行速度より ※最適化無し

75. 300 倍以上の速さ ※Core i5の実行速度より ※最適化した場合の予想値

76. CUDAを用いた場合のPIV解析時間 0 sec 10 sec 20 sec 30 sec 40 sec 50 sec 2枚 30枚現在値予想値 ※画像サイズ：1024×1024；検査領域：48×48；探査領域：24×24

77. CUDAを用いた場合のPIV解析時間 0 sec 10 sec 20 sec 30 sec 40 sec 50 sec 2.75 sec 2枚 30枚現在値予想値 ※画像サイズ：1024×1024；検査領域：48×48；探査領域：24×24

78. CUDAを用いた場合のPIV解析時間 0 sec 10 sec 20 sec 30 sec 40 sec 50 sec 2.75 sec 2枚 0.03 sec 30枚現在値予想値 ※画像サイズ：1024×1024；検査領域：48×48；探査領域：24×24

79. CUDAを用いた場合のPIV解析時間 0 sec 10 sec 20 sec 30 sec 40 sec 50 sec 2.75 sec 2枚 0.03 sec 41.25 sec 30枚現在値予想値 ※画像サイズ：1024×1024；検査領域：48×48；探査領域：24×24

80. CUDAを用いた場合のPIV解析時間 0 sec 10 sec 20 sec 30 sec 40 sec 50 sec 2.75 sec 2枚 0.03 sec 41.25 sec 30枚 0.41 sec 現在値予想値 ※画像サイズ：1024×1024；検査領域：48×48；探査領域：24×24

81. CUDAを用いた場合のPIV解析時間 0 sec 10 sec 20 sec 30 sec 40 sec 50 sec 2.75 sec 2枚 0.03 sec 41.25 sec 30枚 0.41 sec 現在値予想値 30枚を処理するのに1秒以下 ※画像サイズ：1024×1024；検査領域：48×48；探査領域：24×24

82. フレームレートより速い解析スピード

84. リアルタイムレンダリング

85. 解析スタイルを大きく変えるリアルタイムレンダリング

86. 今後の課題

87. 今後の課題 • PIV（OCC）プログラムの改良

88. 今後の課題 • PIV（OCC）プログラムの改良 • リアルタイムレンダリング（理想）

89. !ank y"

CUDAを利用したPIV解析の高速化

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to CUDAを利用したPIV解析の高速化

Similar to CUDAを利用したPIV解析の高速化 (20)

More from 翔新史

More from 翔新史 (7)

Recently uploaded

Recently uploaded (6)