姫野ベンチマークのマルチGPU実行および最適化
非圧縮流体解析コードの性能評価を行うためのベンチマークコードである「姫野ベンチマークMPI版」について、NVIDIA GPUへの移植および最適化を行い、32枚のGPUを用いて実効性能1TFLOPSを実現しました。
性能強化
GPGPUコンピューティングにおいてその性能を引き出すには、GPUのハードウェア構造を理解した上での適切な最適化を行う必要があります。
姫野ベンチマークMPI版については、「GPU上での演算性能を向上させるための最適化」や、「GPU上のメモリとメインメモリの間のデータ転送、およびMPI通信をGPU上での演算と同時に行うことによる転送、通信時間の隠蔽」等の最適化を行いました。