研究

東工大ニュース

スーパーコンピュータ「京」がGraph500において9期連続で世界第1位を獲得

ビッグデータの処理で重要となるグラフ解析で最高レベルの評価

RSS

2019.06.21

理化学研究所(理研)、九州大学、東京工業大学、バルセロナ・スーパーコンピューティング・センター、富士通株式会社、株式会社フィックスターズによる国際共同研究グループは、ビッグデータ処理(大規模グラフ解析)に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ「京(けい)」[補足1]による解析結果で、2018年11月に続き9期連続(通算10期)で第1位を獲得しました。

このたび、ドイツのフランクフルトで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「ISC2019」で6月18日(日本時間6月18日)に発表されました。

大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析において重要となるもので、「京」は運用開始から6年以上が経過していますが、今回のランキング結果によって、現在でもビッグデータ解析に関して世界トップクラスの極めて高い能力を有することが実証されました。本成果の広範な普及のため、国際共同研究グループはプログラムのオープンソース化を行い、GitHubレポジトリより公開中です。今後は大規模高性能グラフ処理のグローバルスタンダードを確立していく予定です。

※ 研究支援

本研究の一部は、科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出(研究総括:佐藤三久)」における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤(研究代表者:藤澤克樹、拠点代表者:鈴村豊太郎)」および「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化(研究総括:喜連川優)」における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術(研究代表者:松岡聡)」の一環として行われました。

スーパーコンピュータ「京」

スーパーコンピュータ「京」

Graph500上位10位

このたび公開されたGraph500の上位10位は以下の通りです。

Graph500とは

近年活発に行われるようになってきた実社会における複雑な現象の分析では、多くの場合、分析対象は大規模なグラフ(節と枝によるデータ間の関連性を示したもの)として表現され、それに対するコンピュータによる高速な解析(グラフ解析)が必要とされています。例えば、インターネット上のソーシャルサービスなどでは、「誰が誰とつながっているか」といった関連性のある大量のデータを解析するときにグラフ解析が使われます。さらにSociety 5.0[補足2]に向けた取り組みの中では、IoTなどの技術で取得された大量のデータをグラフデータに変換して計算機で高速処理することによって、新規ビジネスアプリケーションの開拓が推進されています。これらは新しい産業の創出とコストや廃棄物排出の削減の両立を目的としており、SDGs[補足3]の特に 9 (産業・技術革新・社会基盤) および11(持続可能なまちづくり)の推進に大きく寄与することが期待されています。このような多種多様な応用を持つグラフ解析の性能を競うのが、2010年から開始されたスパコンランキング「Graph500」です。

規則的な行列演算である連立一次方程式を解く計算速度(LINPACK[補足4])でスーパーコンピュータを評価するTOP500[補足5]においては、「京」は2011年(6月、11月)に第1位、その後、2019年6月17日に公表された最新のランキングでは第20位です。一方、Graph500ではグラフの探索という複雑な計算を行う速度(1秒間にグラフのたどった枝の数(TEPS[補足6]))で評価されており、計算速度だけでなく、アルゴリズムやプログラムを含めた総合的な能力が求められます。

Graph500の測定に使われたのは、「京」が持つ88,128台のノード[補足7]の内の82,944台で、約1兆個の頂点を持ち16兆個の枝から成るプロブレムスケール[補足8]の大規模グラフに対する幅優先探索問題を0.45秒で解くことに成功しました。ベンチマークのスコアは31,302GTEPS(ギガテップス)です。Graph500第1位獲得は、「京」が科学技術計算でよく使われる規則的な行列演算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い能力を有していることを実証したものであり、幅広い分野のアプリケーションに対応できる「京」の汎用性の高さを示すものです。また、それと同時に、高いハードウェアの性能を最大限に活用できる研究チームの高度なソフトウェア技術を示すものと言えます。「京」は、国際共同研究グループによる「ポストペタスケールシステムにおける超大規模グラフ最適化基盤」および「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」の2つの研究プロジェクトによってアルゴリズムおよびプログラムの開発が行われ、2014年6月に17,977GTEPSの性能を達成し第1位、さらに「京」のシステム全体を効率良く利用可能にするアルゴリズムの改良を行い、2倍近く性能を向上させ、2015年7月に31,302GTEPSを達成し第1位でした。そして今回のランキングでもこの記録により、世界第1位を9期連続(通算10期)で獲得しました。

これまでの幅優先探索問題(BFS)[補足9]に加えて2017年11月から最短路問題(SSSP)[補足10]に対する結果も公開されており、今後はさらに別の問題への適用も予定されています。

0.45秒は従来の中央値での値。調和平均での値は0.56秒。[補足6]参照。

今後の展望

大規模グラフ解析においては、アルゴリズムおよびプログラムの開発・実装によって性能が飛躍的に向上する可能性を示しており、今後もさらなる性能向上を目指していきます。また、2021年頃の共用開始を目指しているスーパーコンピュータ「富岳(ふがく)」[補足11] においても上記で述べた実社会の課題解決および科学分野の基盤技術へ貢献すべく、さまざまな大規模グラフ解析アルゴリズムおよびプログラムの研究開発を進めていきます。

補足説明

[補足1] スーパーコンピュータ「京(けい)」 : 文部科学省が推進する「革新的ハイパフォーマンス・コンピューティング・インフラ(HPCI)の構築」プログラムの中核システムとして、理研と富士通が共同で開発を行い、2012年に共用を開始した計算速度10ペタフロップス級のスーパーコンピュータ。「京(けい)」は理研の登録商標で、10ペタ(10の16乗)を表す万進法の単位であるとともに、この漢字の本義が大きな門を表すことを踏まえ、「計算科学の新たな門」という期待も込められている。

[補足2] Society 5.0 : 「サイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に融合させたシステムにより、経済発展と社会的課題の解決を両立する、人間中心の社会」として、第5期科学技術基本計画において我が国が目指すべき未来社会の姿として初めて提唱された。

[補足3] SDGs(Sustainable Development Goals-持続可能な開発目標) : 2015年9月の国連サミットで採択された「持続可能な開発のための2030アジェンダ」にて記載された2016年から2030年までの国際目標。持続可能な世界を実現するための17のゴール・169のターゲットから構成され、地球上の誰一人として取り残さない(leave no one behind)ことを誓っている。

[補足4] LINPACK : 米国のテネシー大学のJ. Dongarra博士によって開発された規則的な行列計算による連立一次方程式の解法プログラムで、TOP500リストを作成するために用いるベンチマーク・プログラム。ハードウェアのピーク性能に近い性能を出しやすく、その計算は単純だが、応用範囲が広い。

[補足5] TOP500 : TOP500は、世界で最も高速なコンピュータシステムの上位500位までを定期的にランク付けし、評価するプロジェクト。1993年に発足し、スーパーコンピュータのリストを年2回発表している。

[補足6] TEPS : Graph500ベンチマークの実行速度を表すスコア。Graph500ベンチマークでは与えられたグラフの頂点とそれをつなぐ枝を処理する。Graph500におけるコンピュータの速度は1秒間あたりに調べ上げた枝の数として定義されている。TEPSはTraversed Edges Per Secondの略。今回から TEPS 値の計算には調和平均を使用することで統一された。そのためTEPS 値の表記が以前の38,621GTEPS(中央値)から, 31,302GTEPS(調和平均)に変更されている。

[補足7] ノード : スーパーコンピュータにおけるオペレーティングシステム(OS)が動作できる最小の計算資源の単位。「京」の場合は、一つのCPU(中央演算装置)、一つのICC(インターコネクトコントローラ)、および16GBのメモリから構成される。

[補足8] プロブレムスケール : Graph500ベンチマークが計算する問題の規模を表す数値。グラフの頂点数に関連した数値であり、プロブレムスケール40の場合は2の40乗(約1兆)の数の頂点から構成されるグラフを処理することを意味する。

[補足9] 幅優先探索問題(BFS) : 最短路問題と同じく、グラフ上で指定された二つの頂点間の距離が最小となる経路を求める問題。グラフの各枝の重みが等しい場合を想定しており、主にインターネット上のソーシャルデータや金融データなどの解析に用いられる。BFSはBreadth-First Searchの略。

[補足10] 最短路問題(SSSP) : 幅優先探索問題と同じく、グラフ上で指定された二つの頂点間の距離が最小となる経路を求める問題。グラフの各枝の重みが異なる場合を想定しており、主に道路あるいは鉄道などの交通データ上での経路案内などに用いられる。SSSPはSingle-Source Shortest Pathの略。

[補足11] スーパーコンピュータ「富岳(ふがく)」 : スーパーコンピュータ「京」の後継機。2020年代に、社会的・科学的課題の解決で日本の成長に貢献し、世界をリードする成果を生み出すことを目的とするスーパーコンピュータ。2014年度から開始された文部科学省のフラッグシップ2020プロジェクト(ポスト「京」の開発)事業の下、理研計算科学研究センターが「富岳(ふがく)」を開発整備し2021年頃の共用開始を目指している。

情報理工学院

情報理工学院 ―情報化社会の未来を創造する―
2016年4月に発足した情報理工学院について紹介します。

情報理工学院

学院・系及びリベラルアーツ研究教育院outer

お問い合わせ先

発表内容について

理化学研究所 計算科学研究推進室

広報グループ 岡田昭彦

E-mail : r-ccs-koho@ml.riken.jp
Tel : 078-940-5625 / FAX : 078-304-4964

機関窓口

理化学研究所 広報室 報道担当

E-mail : ex-press@riken.jp
Tel : 048-467-9272 / FAX : 048-462-4715

国立大学法人九州大学 広報室

E-mail : koho@jimu.kyushu-u.ac.jp
Tel : 092-802-2130 / FAX: 092-802-2139

国立大学法人 東京工業大学 広報・社会連携本部 広報・地域連携部門

E-mail : media@jim.titech.ac.jp
Tel : 03-5734-2975 / FAX : 03-5734-3661

富士通株式会社 富士通コンタクトライン(総合窓口)

Tel : 0120-933-200
受付時間 : 9:00 - 17:30(土曜日・日曜日・祝日・当社指定の休業日を除く)

株式会社フィックスターズ マーケティング担当

E-mail : press@fixstars.com
Tel : 03-6420-0758

科学技術振興機構 広報課

E-mail : jstkoho@jst.go.jp
Tel : 03-5214-8404 / FAX : 03-5214-8432

JST事業に関すること

科学技術振興機構 戦略研究推進部

舘澤博子

E-mail : crest@jst.go.jp
Tel : 03-3512-3525 / FAX : 03-3222-2063

6月21日16:15 本文中に一部修正が入りました。

RSS