東工大ニュース

東工大TSUBAME3.0と産総研AAICが省エネ性能スパコンランキングで世界1位・3位を獲得

RSS

公開日:2017.06.19

授賞式の様子((左から4人目、5人目)学術国際情報センターの松岡教授、額田彰特任准教授)
授賞式の様子
((左から4人目、5人目)学術国際情報センターの松岡教授、額田彰特任准教授)

  • 東工大の次期スーパーコンピューター「TSUBAME3.0」が、Green500 List(省エネ性能の世界スパコンランキング)において世界1位を達成
  • 産総研のクラウド型計算システム「産総研AIクラウド」(AAIC)が、同Green500 Listにおいて世界3位、空冷方式では世界1位を達成
  • 「産総研・東工大 実社会ビッグデータ活用オープンイノベーションラボラトリ」(RWBC-OIL)における計算プラットフォーム構築技術の研究協力による成果

本学と国立研究開発法人産業技術総合研究所(理事長 中鉢良治、以下、産総研)でそれぞれ保有するスパコンが、世界のスパコンの省エネ性能ランキングGreen500 List[用語1]において1位と3位を獲得しました。これはドイツ・フランクフルト市で開かれたスーパーコンピューターに関する国際会議“ISC HIGH PERFORMANCE 2017(ISC 2017)”において6月19日(ドイツ時間)に発表されました。本成果は、2017年2月20日に設置された「産総研・東工大 実社会ビッグデータ活用オープンイノベーションラボラトリ」(ラボ長 松岡聡、以下、RWBC-OIL)における研究協力によるものです。

東工大 学術国際情報センター(GSIC)が2017年8月に本格稼動予定のスーパーコンピューター「TSUBAME3.0」は、Green 500 Listの2017年6月版において1ワットあたり14.110ギガフロップス[用語2]という値を記録し、実際に運用するスパコンとしては日本で初めて世界1位になりました。

また、産総研 人工知能研究センター(AIRC)が、2017年4月に稼働を開始したクラウド型計算システム「産総研AIクラウド(AAIC)」が、上記のGreen 500 Listにおいて1ワットあたり12.681ギガフロップスという値を記録して世界3位になりました。

東工大と産総研は長年にわたり高性能計算技術・省電力計算技術・ビッグデータ計算技術などの分野における研究協力を続け、RWBC-OILを設置して本格的な活動を開始しています。東工大と産総研の計算プラットフォームが世界1位と3位という好成績を獲得できたのはRWBC-OILによる省エネ型高性能計算プラットフォーム構築技術など両機関の研究協力が加速できたことによるものです。

TSUBAME 3.0(完成予想図)
TSUBAME 3.0(完成予想図)

産総研AIクラウド(AAIC)
産総研AIクラウド(AAIC)

東工大のTSUBAME3.0は、2010年より「みんなのスパコン」として国内外の産学官の研究開発を支えてきたTSUBAME2.0/2.5の後継機です。その設計・開発・運用準備は東工大GSICが日本SGI株式会社・米国NVIDIA社、関連各社と協同で進めており、次のような特長を持ちます。

  • 人工知能(AI)やビッグデータ分野では16bitの半精度[用語3]での計算処理が有効とされており、この精度において47.2ペタフロップスと、国内最大級の性能となります。NVIDIA社の最新GPU[用語4] Tesla P100 を2,160基搭載し、このような性能が実現されました。
  • コンピューターそのものと冷却システムの双方が、世界トップクラスの省エネ性能を持ちます。計算ノードには高性能かつ省電力な最新のGPUを搭載し、冷却については、外気に近い温度の冷却水を用いてGPU/CPUの直接冷却を行うなどにより、高い省エネ性を実現しています。とくに冷却効率を示す指標の一つであるPUE(Power Usage Effectiveness)[用語5]の値は1.033(推定値)と極めて高い効率となり、より少ない電力での計算を可能にします。

これらの設計には、東工大GSICが推進してきた文部科学省「スパコン・クラウド情報基盤におけるウルトラグリーン化技術」および「スマートコミュニティ実現のためのスパコン・クラウド情報基盤のエネルギー最適化の研究推進」などのプロジェクトの研究成果が活用されています。これらのプロジェクトによるテストベッドスパコン「TSUBAME-KFC[用語6]」は、2013年・2014年にGreen 500 List世界1位を獲得しましたが、そこで培われた高温液体冷却に関する知見などをもとに、TSUBAME3.0は設計されました。

また、産総研AAICは、経済産業省「人工知能・IoTの研究開発加速のための環境整備事業」(平成27年度補正予算)の一環として整備されたAI・ビッグデータ処理のための共用計算プラットフォームです。これを用いて産学官連携を促進し、多様な事業者による人工知能・IoT技術の研究開発・実証の加速を目的としています。産総研 人工知能研究センターが産総研AAICの設計・開発を行い、一般競争入札により日本電気株式会社および米国NVIDIA社の技術を採用しました。2017年4月に試験的運用を開始し、以下の特長を持ちます。

  • NVIDIA社のTesla P100を計400基搭載し、半精度での性能指標で8.6ペタフロップスと、AI研究開発にフォーカスした共用計算プラットフォームとして現在国内最大級の性能となります。
  • リアルタイムの電力モニタリングデータに基づいて、ストレージシステム、ネットワーク機器を含むシステム全体の消費電力を最大で150 kWに抑える省エネ運用を可能としました。これにより、電力あたりの計算性能を維持しつつ、特殊な冷却システムを必要とせず、一般的なサーバールームでの運用を可能としています。

産総研AAICでは、RWBC-OILによる東工大GSICとの研究協力を通じて確立してきた技術的知見などが活用されています。

今回の結果は、両機関における長年の多岐にわたる大規模計算機の省エネルギー化に関わる研究成果が結実したものと言えます。東工大においては、前述のプロジェクトだけでなく、科学技術振興機構の戦略的創造研究推進事業(JST-CREST)「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」や「ULP-HPC 次世代テクノロジのモデル化・最適化による超低消費電力ハイパフォーマンスコンピューティング」などの基礎研究プロジェクト、また米国NVIDIA社との数年来の共同研究プロジェクトにおいて、最新技術であるGPUのスパコンにおける活用や高性能計算システム(HPCシステム)の省電力化の研究などが続けられてきました。産総研においてはNEDO「グリーンネットワーク・システム技術研究開発」で得られた電力モニタリングに応じたサーバー運用技術の適用、さらにRWBC-OILによりGPUベースの計算プラットフォーム構築に関する相互の技術共有が加速されました。これらを総合することで今回の世界でトップクラスの実用に供される省エネなシステムの実現という成果につながりました。

この成果は産総研に2017年度導入予定の「AI橋渡しクラウド(AI Bridging Cloud Infrastructure、ABCI)[用語7]」の構築に活かしていきます。今後両機関は、RWBC-OILにおいて、TSUBAME3.0と産総研AAICを相互に活用しながら、ビッグデータ活用のためのシステム連携技術や大規模データ解析技術の研究を行うとともに、運用から発生する課題をハードウェア構築技術の高度化研究に活かします。RWBC-OILでの研究活動を通じて、両機関の技術融合による実社会ビッグデータの活用基盤の構築を行い、人工知能を含むビッグデータ処理技術・省エネ技術などの実社会への応用を目指します。

用語説明

[用語1] Green500 List : スパコンのベンチマーク速度性能を半年ごとに世界1位から500位までランキングするThe TOP 500 Listに対して、近年のグリーン化の潮流を受けTOP500のスパコンの電力性能(速度性能値/消費電力)を半年ごとにランキングしているリスト。

[用語2] メガフロップス(Mega FLOPS)、ギガフロップス(Giga FLOPS)、ペタフロップス(Peta FLOPS)、テラフロップス(Tera FLOPS) : フロップスは1秒間で何回浮動小数点の演算ができるかという性能指標。メガ(10の6乗)、ギガ(10の9乗)、テラ(10の12乗)、ペタ(10の15乗)などは接頭語。

[用語3] 半精度 : 数値(実数)のコンピューター内の表現方法の一つ。2バイトで表現され、有効桁数は10進で約3.3桁である。最新のGPUなどを用いると、倍精度(8バイト、約16桁)や単精度(4バイト、約7桁)よりも高速な演算が可能であり、機械学習/AI分野における活用の研究が進んでいる。

[用語4] GPU(Graphics Processing Unit) : 本来はコンピューターグラフィックス専門のプロセッサだったが、グラフィックス処理が複雑化するにつれ性能および汎用性を増し、現在では実質的にはHPC用の汎用ベクトル演算プロセッサに進化している。

[用語5] PUE(Power Usage Effectiveness) : データセンターやスパコンの冷却効率を示す指標の一つ。システム全体電力を計算ノードなどのIT機器電力で割った値で、1.0に近いほど冷却機器などの電力効率が良いとされる。

[用語6] TSUBAME-KFC : TSUBAMEシリーズと同様にGPUを搭載するスパコンで、スパコンの省電力化のための実証実験設備である。油浸による冷却システムを採用。2013年11月と2014年6月の世界のスパコンの省エネランキングGreen500で第1位になっている。

[用語7] AI橋渡しクラウド(AI Bridging Cloud Infrastructure、ABCI) : 産総研が今年度末の導入を計画しているクラウドシステムで、TSUBAME3.0に匹敵する省エネ性能と、世界トップクラスの人工知能処理性能の両立を目指している。

お問い合わせ先

東京工業大学 学術国際情報センター

E-mail : kib.som@jim.titech.ac.jp

Tel : 03-5734-2087

産業技術総合研究所
人工知能研究センター 人工知能クラウド研究チーム
研究チーム長 小川宏高

Tel : 029-861-3092

取材申し込み先

東京工業大学 広報・社会連携本部 広報・地域連携部門

E-mail : media@jim.titech.ac.jp

Tel : 03-5734-2975 / Fax : 03-5734-3661

産業技術総合研究所 企画本部 報道室

E-mail : press-ml@aist.go.jp

Tel : 029-862-6216 / Fax : 029-862-6212

6月28日 16:20 本文中の誤記を修正しました。
6月28日 14:05 授賞式の写真を追加しました。
6月20日 10:55 TSUBAME3.0の性能値に誤りがあったため、本文とPDF内の該当箇所を修正しました。

RSS