NVIDIAが新世代GPUアクセラレーションボード「Tesla K20X」

倍精度演算性能を大幅改善、CCSなど主要アプリ70種以上が対応

 2012.12.14−NVIDIA(エヌビディア)は、GPUコンピューティングのためのハイエンドアクセラレーターボード「Tesla K20X」を提供開始した。すでに提供中の「同K20」と合わせて新しい“Kepler”世代のラインアップが整ったことになる。倍精度演算性能が大幅に向上していることが特徴で、メジャーな70本を含む合計200本以上のGPU対応アプリケーションが揃ってきている。CCS関連でも、分子動力学法(MD)のAMBERやCHARMM、GROMACS、LAMMPS、NAMD、分子軌道法(MO)のGAMESS、ADF、Q-CHEM、TeraChem、材料科学のWL-LSMS、VASP、バーチャルスクリーニングのFastROCS、Molegro Vertual Dockerなど多くが対応しつつある。

 「Tesla K20/K20X」に搭載されているGPUは、最新の“Kepler”アーキテクチャーに基づいているが、コンシューマー製品の「GeForce」シリーズに使われているものとは異なる専用設計であり、「GK110」と呼ばれる。集積度は71億トランジスターで、演算器として最大15個のSMX(ストリーミングマルチプロセッサーエクストリーム)が実装されている。K20にもK20Xにも1個のGK110が搭載されるが、SMXの数がK20Xは最大の15個、K20は14個となる。SMX当たり192コアを持つので、総コア数としてはK20Xが2,688コア、K20は2,496コアとなる。

 前世代の“Fermi”に使われていたSM(ストリーミングマルチプロセッサー)は32コアだったが、倍精度演算時は2コアを使用するため、実質16コアでの動作となっていた。これに対して、今回のKepler SMXは倍精度演算器を独立させており、192コアのうちの64コアが倍精度専用。ただし、SMXは消費電力を抑えるために動作周波数をSMの半分に落としている。つまり、倍精度演算時、SMXはSMの4倍のコアが働くことになるが、性能としてはSMの2倍ということになる。

 また、GK110の特徴として、アプリケーションの実行効率を高める“Hyper-Q”と“動的並列処理”という2つの機能が組み込まれている。Fermi世代ではCPUからGPUへの命令をシリアルにしか実行できず、MPIタスクなどのボトルネックが起きるという問題があった。これを解決したのがGK110のHyper-Qで、CPUから最大32の命令をGPUに対して同時に発行できる。これにより、アプリケーションによってはK20/K20Xに置き換えるだけでパフォーマンスが大幅に改善される見込みがある。

 もう1つの動的並列処理は、GPU内部で実行中のカーネルから新たなカーネルを生成することを可能にする技術。Fermi世代はいちいちCPUからGPUのカーネルをコールする必要があり、CPUとGPUを行ったり来たりする特殊なプログラミングが必要になる場合があったが、GK110の動的並列処理はCPUに頼らずにGPUから別のGPUを呼び出すことができる。これにより、アプリケーションの移植が楽になり、GPUコンピューティングには得手不得手があるといわれた問題の解消にもつながると期待されるということだ。

 アクセラレーターボードとしてのスペックをまとめると、K20Xは2,688コアで、倍精度1.31テラFLOPS、単精度3.95テラFLOPS、メモリーバンド幅が250GB/s、メモリー容量は6GB、消費電力235W、K20は2,496コアで倍精度1.17テラFLOPS、単精度3.52テラFLOPS、メモリーバンド幅が208GB/s、メモリー容量は5GB、消費電力225W。K20Xは本体に冷却ファンがないので、ワークステーションに装着することはできず、サーバー専用となる。価格は、K20の参考価格で38万円。

              ◇        ◇       ◇

 11月に発表された全世界のスーパーコンピューターのトップ500リストで、第1位になった米エネルギー省(DOE)のオークリッジ国立研究所の「TITAN」に使われているのもK20Xである。1万8,688個のK20Xが搭載された「Cray XK7」スーパーコンピューターがベースで、ピーク性能は27ペタFLOPS。LINPACKベンチマークで17.59ペタFLOPSを計測し、ナンバーワンの座に就いた。

 このTITANは、日本の「京」と同様に民間とも共用されるオープン型スパコンで、CCS関連の用途での活用も多くなるとみられる。実際、WL-LSMSを使った磁性材料のシミュレーションで10ペタFLOPS以上の実行性能を記録しているという。







******

<関連リンク>:

エヌビディア(Tesla製品情報ページ)
http://www.nvidia.co.jp/object/tesla-supercomputing-solutions-jp.html

エヌビディア(GPU対応アプリケーション紹介ページ)
http://www.nvidia.co.jp/object/gpu-applications-jp.html


ニュースファイルのトップに戻る