スパコン「TSUBAME」が世界の最前線を走り続ける理由 — 松岡聡

スパコン「TSUBAME」が世界の最前線を走り続ける理由 ― 松岡聡

vol. 27

学術国際情報センター（GSIC）教授

松岡聡（Satoshi Matsuoka）

2017年6月21日、新聞の紙面を「東工大のスパコン『TSUBAME^※1』、省エネ性能で世界一」というタイトルが飾った。これは、スーパーコンピュータ（以下、スパコン）の省エネ性能を競う国際ランキング「グリーン500^※2」で、東工大のスパコンの最新機種「TSUBAME3.0」が世界第1位を獲得したというニュースだ。

グリーン500は、スパコンの省エネ性能向上を目的に2007年に始まったランキングで、年2回、1～500位を公表している。今回は、第3位に産業技術総合研究所のスパコン「AIクラウド」も名を連ねており、日本のスパコンの省エネ性能の高さが伺える。

そして、このTSUBAME3.0の開発を手掛け、AIクラウドの設計にも関与したのが、学術国際情報センター（GSIC）の松岡聡である。

スパコン省エネ性能ランキング「グリーン500」トップ10

TSUBAMEは、東工大のシンボルマークである「ツバメ」の名を冠した超高性能かつ大規模なクラスタ型のスパコンだ。現在、「みんなのスパコン」として、学術利用と産業利用の両面で共同利用サービスを提供しており、東工大のみならず、数多くの大学、研究機関、民間企業が利用し、多くの成果を出している。

TSUBAME3.0

演算部名		計算ノード 540台
ノード構成（1台あたり）	CPU	Intel Xeon E5-2680 v4 2.4GHz × 2CPU
	コア数/スレッド	14コア / 28スレッド × 2CPU
	メモリ	256GiB
	GPU	NVIDIA TESLA P100 for NVlink-Optimized Servers × 4
	SSD	2TB
	インターコネクト	Intel Omni-Path HFI 100Gbps × 4

TSUBAME3.0 計算ノードの構成

世界トップレベルの計算処理速度と省エネ性能を実現

TSUBAMEの変遷

松岡がクラスタ型の計算機の研究を始めたのは1996年。それらの成果を経て2004年にTSUBAMEの開発を本格的にスタートさせ、2006年の運用開始以来、バージョンアップを重ねながら、常に世界の最前線を走り続けてきた。第2世代は2010年11月に運用を開始したTSUBAME2.0、第2.5世代は2013年9月運用開始のTSUBAME2.5。そして、第3世代が、2017年8月に運用を開始したTSUBAME3.0である。

「実はグリーン500で世界第1位を獲得したのは今回が3回目です。2013年11月と2014年6月に、TSUBAME3.0の実証実験機として開発したTSUBAME-KFC^※3が獲得しました。しかし、実用機としては、初めての第1位ですので、大変意義深いことだと思います」と松岡は語る。

グリーン500では、消費電力1ワット当たりの計算速度で省エネ性能を評価しており、そこにはスパコンの冷却に要する消費電力量は含まれていない。しかし、実際にスパコンを運用する上では、冷却にかかる消費電力量が非常に膨大で、大きな課題となっているのだ。

その課題に対し、TSUBAME3.0の冷却にかかる消費電力量は、運用全体の3%程度と少なく、他のスパコンの10分の1程度に抑えている。まさに実用機として、極めて省エネ性能に優れたスパコンなのだ。

TSUBAMEの特徴は省エネ性能だけではない。計算処理速度^※4でも世界トップレベルだ。例えば、TSUBAME2.0は、スパコンの計算処理速度を競う「トップ500」で、運用開始時の2010年11月には世界第4位、国内第1位を獲得している。

また、GSICの下川辺隆史助教や額田彰特任准教授らが、溶けた合金が凝固して結晶化するプロセスを、TSUBAME2.0を用いたコンピュータ・シミュレーションにより、世界で初めて詳細に再現することに成功。その功績が称えられ、2011年、松岡は下川辺隆史助教や、その上司であり共同研究者でもある青木尊之教授らとともにスパコン界で最も権威のある「ACMゴードン・ベル賞」を受賞した。

このように、圧倒的な計算処理速度、省エネ性能、低コストで、高性能科学技術計算（HPC）に貢献してきたTSUBAMEだが、TSUBAME3.0では新たに、人工知能（AI）やビッグデータ処理で求められる精度においても、国内トップクラスの性能を実現している。

「科学の発展においては、長く“理論”と“実験”が大きな役割を果たしてきました。そして近年、コンピュータ・シミュレーションに代表される“計算科学”が第3の科学として大きな役割を果たすようになりました。さらに、ここ数年で急速に注目を浴びてきているのが、第4の科学と言われる“データ科学”です。TSUBAME3.0では、データ科学においても高性能を誇るスパコンを他に先駆け実現しており、多くの利用者から大きな期待が寄せられています」と松岡は語る。

トレンドを追うのではなくトレンドメーカーになる

松岡聡教授

しかしなぜ、松岡は世界トップレベルのスパコンを開発し続けることができるのだろうか。

「TSUBAME3.0を例に挙げれば、私は、AIやビッグデータが注目されるようになったから、TSUBAME3.0に機能を搭載したわけではありません。10年以上も前、“情報爆発”が叫ばれるようになり始めた頃に、『近い将来、大規模なデータの処理が求められるようになるだろう』と予測し、その時点で、大規模データの高速処理に関する基礎研究をすでに始めていました。TSUBAME3.0は、その研究成果に過ぎないのです。時代のニーズに応えたというよりも、時代が追いついたということです」と松岡。

松岡の10年先、20年先を見据えた研究開発のスタイルは、TSUBAMEの初号機からまったく変わっていないという。「私はトレンドを追うのではなく、常にトレンドメーカーになることを意識しながら、研究開発を進めてきました」

その象徴が、世界初のGPUの搭載である。GPUとは、Graphics Processing Unit（グラフィックスプロセッシングユニット）の略称で、画像処理に特化したプロセッサのことだ。TSUBAMEは、CPUによるスカラー演算とGPUによるベクトル演算を組み合わせた「ハイブリッドアーキテクチャ」で世界的に有名で、特にTSUBAMEは、世界で初めて大規模なGPUを採用したことが圧倒的な計算処理速度と高い省エネ性能をもたらし、それがゴードン・ベル賞受賞につながった。

以来、世界中でGPUを採用したスパコンの開発が行われるようになった。米国で最高性能を誇るオークリッジ国立研究所のスパコンもGPUを採用しており、松岡はGPGPU（GPUの演算資源を画像処理以外の目的に応用する技術のこと）のパイオニアとして認められている。

GPU採用のきっかけを松岡は次のように語る。「スパコンの性能を向上させる方法は2通りあります。消費電力量は上がってもよいからCPUの処理速度を上げるか、消費電力量を抑える代わりにCPUの個数を増やすかです。以前は、前者を選ぶ傾向にありましたが、2000年頃、消費電力量が急増し、特に日本では省エネ性能が強く求められるようになりました。そこで私は、省エネ技術に関する基礎研究に着手し、TSUBAMEの初号機からその技術を導入しました。しかし、そのうち、CPUの微細化により、CPUの個数を大幅に増やしても、スパコンの大きさや台数、消費電力量はそれほど増えなくなりました。そこで、私が次に着手したのが、大量のCPUを使った超並列分散処理に関する基礎研究でした。今後、計算処理の高速化において最も有用な手段であると判断したからです」

NVIDIA Tesla P100

TSUBAMEシリーズはNVIDIA社製GPUをいち早く採用。TSUBAME3.0では「Tesla P100」を2,160基搭載している。

その際、松岡がこだわったのは、実用化を見据え、特注品ではなく民生用のCPUを使うことだった。そういった中で目に留まったのが、GPUだった。GPUについて調査した結果、うまくプログラミングさえできれば、同世代のCPUと比べて、計算性能とメモリー性能の両面において、5～6倍の電力性能を実現できることが分かった。

初期のGPUではプログラミングができなかったが、複雑なコンピュータ・グラフィックス（CG）が求められるようになるにつれ、プログラミングが可能なGPUが出始めていた。松岡はこれに目を付けたのだ。このGPUを大量に搭載して、超並列分散処理を実現できれば、HPC（高性能科学技術計算）にも有用な上、大幅な省エネも図れると確信し、2003年頃から基礎研究を開始したのである。

「当時、周囲のコンピュータの専門家からは『クレイジーだ』と言われ、GPUのメーカーからは『GPUはグラフィックスのワークステーション用に設計開発したものであって、スパコンへの搭載は想定していない』と言われました。しかし、中学生時代からコンピュータを自作し、大学でコンピュータの原理を徹底的に学んでいた私にとっては、GPUの採用は理に適った選択でした」と松岡は振り返る。

いち早く、近い将来、スパコンに求められる機能を察知し、すぐさま基礎研究に着手する—。これが松岡の強さの秘訣だ。しかし、それだけではない。「基礎研究からすぐに応用研究に移行し、ユーザーを巻き込みながら、実践に持ち込むことが何よりも重要なのです」と松岡は強調する。

実際、松岡は早い段階からTSUBAMEの実証実験機を開放し、さまざまな分野の研究者たちにユーザーとして使ってもらうことで、自分では気付かなかった課題を抽出し、実用機としての完成度を高めていった。この姿勢が研究開発をさらに加速させていった。「これが、世界の最前線を走り続けてこられた一番の理由かも知れませんね」と松岡は分析する。

約10年後のポストムーアに向けて

今後、松岡はTSUBAMEのさらなる大規模化を図っていく計画だ。しかし一方で、将来に対する懸念事項についても口にする。「これまでコンピュータは、ムーアの法則^※5に従い、性能を劇的に向上させてきました。それにより、スマホ上でインターネット経由でハイビジョン動画が見られるようになるなど、質的な変化がもたらされました。ムーアの法則による情報技術のイノベーションは計り知れないものがあります。しかし、ムーアの法則も限界に近づいており、約10年後には我々はいわゆる『ポストムーア』の時代に突入します。今まさに、微細化や超並列分散処理の次の手段を考えなければいけない時期にきているのです」

松岡聡教授

その手段のひとつとして、松岡は、量子コンピュータを挙げる。「しかしながら、量子コンピュータは万能ではありません。既存の汎用コンピュータをすべて量子コンピュータに置き換えることはできません。そこで、私が量子コンピュータ以外に注目しているのが、ニューロモーフィック・コンピュータ、脳型コンピュータです」

これまで、コンピュータ・シミュレーションは、還元主義に立脚していた。還元主義とは、ある事象を構成する要素に細分化していき、その要素同士の相互作用を見ることで、事象全体を理解しようという考え方だ。これは、解像度を上げていくことで、シミュレーションの精度向上を図ろうとするやり方に他ならない。しかし、ポストムーアの時代に突入すると、解像度のさらなる向上は期待できなくなる。それに対し、還元主義ではなく、事象全体を観察し学習することで将来を予想しようというのがAI、さらにはニューロモーフィック・コンピュータの考え方だ。

「これらは、結局、シミュレーションではなく、脳のようにデータから演繹（えんえき）するということです。それによって、計算処理量が劇的に減り、スパコンの計算処理速度は桁違いに向上するといわれています。そして、データから演繹する際に重要な役割を果たすのがAIやビッグデータですが、そのベースとして脳の信号伝達をハードウェアで直接模倣し、著しい効率向上を目指すのがニューロモーフィック・コンピューティングなのです。したがって、ポストムーアとAI、ビッグデータ、さらにニューロモーフィックとの間には密接な関係があります。私がTSUBAME3.0で、いたずらに計算処理速度の向上を狙わず、AIやビッグデータ処理に注力したのには、ポストムーアに向けた第一歩という意味合いもあったのです」と松岡は語る。

最後に松岡は、後進に向けて、次のようなメッセージを贈ってくれた。「省エネ性能も、GPUの搭載による計算処理の高速化も、AIやビッグデータ処理への対応もすべて10年以上前から地道に基礎研究に取り組むことによって初めて実現できたことです。やはり研究成果というのは、一朝一夕に得られるものではなく、非常に時間がかかるものなのです。私のこれまでの研究者人生を振り返って言えることは、決してトレンドに流されることなく、本質を見据え、それに向かっていち早くかつ地道に努力を重ねていくことが大切だということです。これはあらゆる分野においても言えることだと思いますね」

※1 TSUBAME

「Tokyo-tech Supercomputer UBiquitously Accessible Mass-storage Environment」の略称

※2 グリーン500

スパコンのベンチマーク速度性能を半年ごとに世界1位から500位までランキングする「トップ500」に対して、近年のグリーン化の潮流を受けトップ500のスパコンの電力性能（速度性能値／消費電力）を半年ごとにランキングしている。

※3 TSUBAME-KFC

TSUBAMEシリーズと同様にGPUを搭載するスパコンで、スパコンの省電力化のための実証実験設備である。油浸による冷却システムを採用。2013年11月と2014年6月の世界のスパコンの省エネランキング「グリーン500」で第1位になっている。

※4 計算処理速度

フロップスは一秒間で何回浮動小数点の演算ができるか、という性能指標で、ギガ（10の9乗）、テラ（10の12乗）、ペタ（10の15乗）など。1ペタフロップスは1秒間に0.1京回の計算（1兆の1,000倍）

※5 ムーアの法則

半導体の集積密度は18～24ヵ月で倍増するという法則。インテル社創設者のひとりであるゴードン・ムーア氏が1965年に経験則として提唱した。

松岡聡教授

松岡聡（Satoshi Matsuoka）

学術国際情報センター（GSIC）教授

1986年東京大学理学部情報科学科卒業
1993年東京大学大学院博士（理学）取得
1993年東京大学工学系研究科情報工学専攻講師
1996年東京工業大学大学院情報理工学研究科数理・計算科学専攻助教授
2001年東京工業大学学術国際情報センター（GSIC）教授［現職］
2017年産業技術総合研究所実世界ビッグデータ・オープンイノベーションラボセンター長

スペシャルトピックスでは本学の教育研究の取組や人物、ニュース、イベントなど旬な話題を定期的な読み物としてピックアップしています。SPECIAL TOPICS GALLERY から過去のすべての記事をご覧いただけます。

2017年11月掲載

お問い合わせ先

東京科学大学総務部広報課

Email pr.info@adm.isct.ac.jp