東工大の次期スパコン「TSUBAME3.0」が今夏から稼働

AI用途に向け半精度演算性能を重視、最新GPUを2,160基搭載

 2017.02.22−東京工業大学と日本SGIは17日、東京工業大学の次期スーパーコンピューター「TSUBAME3.0」が今年の夏から稼働すると発表した。政府調達の結果、日本SGIが落札したもので、計算ノードとして、エヌビディア製の最新GPUを高密度実装した専用設計のブレードサーバーを搭載した「SGI ICE XA」が540台採用されている。計算性能は現行のTSUBAME2.5のおおむね2倍だが、今回のマシンは人工知能(AI)やビッグデータ解析での利用を念頭に置いて16ビットの半精度演算性能を重視したことが特徴。併用するTSUBAME2.5と合わせるとトータルの半精度演算性能は64.3ペタFLOPSとなり、東京大学の新型スパコン「Oakforest-PACS」を上回る国内最大のデータセンターになるという。

 TSUBAME3.0の計算ノードは、CPUにインテル Xeon E5-2680 V4(14コア)が2個、GPUはエヌビディアのTESLA P100(16GB)を4個搭載し、各GPUは高速なNVLinkで相互に直結されている。さらに、ネットワークにインテルのOmni-Pathを4ポート搭載するなど、通信がボトルネックにならない設計となっている。このブレードサーバーは専用に開発されたもので、1ラックに36ブレードを装着、システム全体は15ラックで構成される。GPUの数は全部で2,160個で、理論最大性能は倍精度(64ビット)で12.15ペタFLOPS、単精度(32ビット)で24.3ペタFLOPS、半精度(16ビット)で47.2ペタFLOPSとなる。

 また、ストレージシステムにはデータダイレクト・ネットワークス(DDN)の「ExaScaler」が採用され、3ラックで15.9ペタバイトの構成となっている。すべてハードディスクであり、将来はSSDストレージを増設することが可能だという。

 TSUBAME3.0は冷却システムもユニーク。グリーンスパコンとして世界トップの「TSUBAME-KFC」で培ったノウハウを参考に、温水(32度C)でCPUとGPUを冷却する機構を導入した。冷却後の水は40度Cに上昇しているが、これを自然大気で冷やして再び循環させる仕組み。冷却に電気を使用しないため、冷却のオーバーヘッドを表すPUE値は1.033と世界トップクラスを実現する予定(通常のデータセンターのPUE値は2〜3、TSUBAME-KFCは1.09)で、グリーンスパコンとしても卓越した性能となっている。

 利用に関しては、これまでのTSUBAMEシリーズと同様に「みんなのスパコン」の理念を継承し、学際大規模情報基盤共同利用・共同研究拠点(JHPCN)や革新的ハイパフォーマンスコンピューティングインフラ(HPCI)、ならびに東工大の学術国際情報センター(GSIC)が運営するTSUBAME共同利用制度を通じ、学外および企業の研究者にも開放していく。

 現在のTSUBAME2.5は物質・材料やライフサイエンス分野のアプリケーションでの利用が多いため、TSUBAME3.0でもこれらが主な用途になるとみられるが、新分野としてAIやビッグデータでの利用が期待される。日本のAI研究の遅れは、機械学習などで使用できる大規模計算機環境の不備が原因だと指摘する意見もあるという。このため、東工大では産業技術総合研究所と共同で「実社会ビッグデータ活用オープンイノベーションラボラトリ」(RWBC-OIL)を設立した。TSUBAMEをビッグデータ処理のためのオープンプラットホームとして整備するとともに、産業界での活用につながるAI技術の開発を目指しており、そうした成果への期待も大きい。

******

<関連リンク>:

東京工業大学学術国際情報センター(トップページ)
http://www.gsic.titech.ac.jp/


ニュースファイルのトップに戻る