スーパーコンピュータ「富岳」がGraph500において世界第1位を獲得
ビッグデータの処理で重要となるグラフ解析で最高レベルの評価
理化学研究所(理研)、九州大学、株式会社フィックスターズ、富士通株式会社による共同研究グループ※は、スーパーコンピュータ「富岳」[1]による測定結果で、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」において、世界第1位を獲得しました。
このランキングは、HPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「ISC2020」と同時期にGraph500 Committeeから発表されます。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析において重要な指標となるもので、「富岳」は開発・整備中ながら2015年6月から9期連続第1位獲得の実績を持つスーパーコンピュータ「京」よりも2倍以上の能力を有することが実証されました。
※共同研究グループ
理化学研究所 計算科学研究センター
アーキテクチャ開発チーム
チームリーダー 佐藤 三久(さとう みつひさ)
上級研究員 児玉 祐悦(こだま ゆうえつ)
研究員 中尾 昌広(なかお まさひろ)
九州大学 マス・フォア・インダストリ研究所
教授 藤澤 克樹(ふじさわ かつき)
株式会社フィックスターズ
エグゼクティブエンジニア 上野 晃司(うえの こうじ)
1.「富岳」測定結果
共同研究グループは、「富岳」の一部である92,160ノード[2](全体の約58%」)を用いて、約1.1兆個の頂点と17.6兆個の枝から構成される超大規模グラフに対する幅優先探索問題を平均0.25秒で解くことに成功しました。Graph500のスコアは、70,980GTEPS(ギガテップス)[3]です。同じく「京」の測定結果は、31,302GTEPS(2019年6月時点)であったため、2倍以上の性能向上を達成しました。
なお、2020年6月時点の「Graph500」のランキング第2位は、中国の「Sunway TaihuLight」で、測定結果は23,756GTEPSです。すなわち、第2位とは約3倍の性能差となります。
<関連リンク>
このたび公開されたGraph500の順位は以下の通りです。https://graph500.org
2.Graph500について
実社会における複雑な現象は、大規模なグラフ(頂点と枝によりデータ間の関連性を示したもの)として表現される場合が多いため、コンピュータによる高速なグラフ解析が必要とされています。例えば、ソーシャル・ネットワークキング・サービスなどでは、「誰と誰がつながっているか」といった関連性のあるデータを解析する際にグラフ解析が用いられます。さらにSociety 5.0[4] に向けた取り組みにおいて、IoT(Internet of Things)などの技術で取得された大量のデータをグラフに変換して計算機で高速処理することによって新しい価値を産み出す新規ビジネスの開拓が推進されています。これらは新しい産業の創出と廃棄物排出の削減の両立を目的としており、「持続可能な開発目標 (SDGs) [5]」のうち特に 9 (産業・技術革新・社会基盤) および11(持続可能なまちづくり)の推進に大きく寄与することが期待されています。このような多種多様な応用を持つグラフ解析の性能を競うのがGraph500です。Graph500は2010年から始まり、そのランキングは年に2回(6月と11月)更新されます。
Graph500では1兆個の頂点を超えるような大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があります。共同研究グループは、 スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めてきました。また下記(1)~(3)の先進的なソフトウェア技術を高度に組合せることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功しています注1)。
(1) 複数のノード間におけるグラフデータの効率的な分割方法
(2) 冗長なグラフ探索を削減するアルゴリズム
(3) スーパーコンピュータの大規模ネットワークにおける通信性能最適化
共同研究グループは、「京」による測定結果で9期連続(2014年6月~2019年6月、通算10期)でGraph500の世界第1位を獲得しました。「京」はすでに運用を終了したため、2019年11月以降のランキングからは外れていますが、今回の「富岳」の測定結果は「京」を大きく上回るものでした。なお、「京」の結果も「富岳」を除いて、いまだ破られていません。
Graph500の第1位獲得は、「富岳」が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い能力を持っていることを実証したものであり、幅広い分野のアプリケーションに対応できるという「富岳」の汎用性の高さを示すものです。また、ハードウェアの性能を最大限に活用できるソフトウェアを開発した、共同研究グループの技術力の高さを示すものでもあります。
<関連リンク>
理研 計算科学研究センター
https://www.r-ccs.riken.jp/jp/
大規模グラフ解析プログラムのGitHubレポジトリ
https://github.com/suzumura/graph500/
注1) Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka, ”Efficient Breadth-First Search on Massively Parallel and Distributed Memory Machines”, Data Science and Engineering, Springer, March 2017, Volume 2, Issue 1, pp 22-35
補足説明
[1] スーパーコンピュータ「富岳(ふがく)」
「京」の後継機。社会的・科学的課題の解決で日本の成長に貢献し、世界をリードする成果を生み出すことを目的とし、電力性能、計算性能、ユーザの利便性・使い勝手の良さ、画期的な成果創出、ビッグデータやAI(人工知能)の加速機能の総合力において世界最高レベルのスーパーコンピュータとして2021年の共用開始を目指している。
「富岳」は"富士山"の異名で、富士山の高さが「富岳」の性能の高さを表し、また富士山の裾野の広がりが「富岳」のユーザの拡がりを意味する。また、"富士山"は海外での知名度も高く、名称として相応しいこと、さらにはスーパーコンピュータの名称は山にちなむ潮流があることなどから理研が選考した。
[2] ノード
スーパーコンピュータにおけるオペレーティングシステムが動作できる最小の計算資源の単位。「富岳」の場合は、1つのCPU(中央演算装置)および32GiB(ギビバイト)のメモリから構成される。
[3] TEPS
Graph500ベンチマークの実行速度を表すスコア。Graph500ベンチマークでは与えられたグラフの頂点とそれをつなぐ枝を処理する。Graph500におけるコンピュータの速度は1秒間あたりに処理した枝の数として定義されている。TEPSはTraversed Edges Per Secondの略。GTEPSのGは10の9乗を表し、GTEPSは1秒あたりに処理した枝の数を10の9乗で割った値である。GTEPS値の計算には、64試行における調和平均が使用されている。
[4] Society5.0
狩猟社会(Society 1.0)、農耕社会(Society 2.0)、工業社会(Society 3.0)、情報社会(Society 4.0)に続く、新たな社会を指すもので、第5期科学技術基本計画において我が国が目指すべき未来社会の姿として初めて提唱された。IoT、ロボット、AI、ビッグデータといった社会の在り方に影響を及ぼす新たな技術をあらゆる産業や社会生活に取り入れ、経済発展と社会的課題の解決を両立していく新たな社会の実現を目指すこととしている。
[5] 持続可能な開発目標 (SDGs)
2015年9月の国連サミットで採択された「持続可能な開発のための2030アジェンダ」にて記載された2016年から2030年までの国際目標。持続可能な世界を実現するための17のゴール、169のターゲットから構成され、発展途上国のみならず、先進国自身が取り組むユニバーサル(普遍的)なものであり、日本としても積極的に取り組んでいる。(外務省ホームページから一部改変して転載)
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザーログイン既に登録済みの方はこちら
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像