NVIDIA、大規模データ分析およびマシンラーニング向けオープンソースGPUアクセラレーション プラットフォームのRAPIDSを公開

HPE、IBM、オラクル、オープンソース コミュニティ、スタートアップがRAPIDSを統合することにより、
エンドツーエンドの予測データ分析のパフォーマンスを大幅に強化

ドイツ、ミュンヘン――GTCヨーロッパ――2018年10月10日―― NVIDIA は本日、データ分析およびマシンラーニング向けの GPU アクセラレーション プラットフォームを発表しました。業界をリードする企業に広く採用されることで、最大規模の企業でもかつてないスピードで大量のデータを分析し、正確なビジネス予測が可能になります。

オープンソースソフトウェアの RAPIDS™ は、クレジットカード詐欺の予想や、小売り在庫の予測や顧客の購入行動を理解するなど、非常に複雑なビジネス課題に取り組むデータ サイエンティストのパフォーマンスを大幅に向上させます。データ分析におけるGPUの重要性についての合意が進むのを反映して、DatabricksやAnacondaといったオープンソース コミュニティのパイオニアから、Hewlett Packard Enterprise や IBM、Oracle などのテクノロジ リーダー企業まで、多くの企業が RAPIDS を支持しています。

データ分析やマシンラーニングのためにアナリストたちが 1 年間に 200 憶ドルをかけてサーバー市場を評価しています。これにより、科学的解析およびディープラーニングと合わせると、ハイパフォーマンスコンピューティング市場の価値はおよそ 360 憶ドルにまで押し上げられています。

GPU テクノロジカンファレンスの基調講演で RAPIDS を紹介した NVIDIA の創業者/CEO の Jensen Huang (ジェンスン フアン) は次のように述べています。「データ分析およびマシンラーニングは、ハイパフォーマンスコンピューティング市場でこれまで加速されてこなかった最大の分野ですが、いま、その時がきています。世界中の巨大産業で、マシンラーニングによって書かれたアルゴリズムが膨大なサーバーの海で実行され、市場や環境の複雑なパターンを検知して、そこからはじき出される迅速かつ正確な予測は収益に直接的に影響しています」

「CUDA およびそのグローバル エコシステム上に構築され、オープンソース コミュニティとの密な協働作業によって、RAPIDS の GPU アクセラレーション プラットフォームは生み出されました。世界で最も一般的なデータ分析ライブラリおよびワークフローとシームレスに統合することで、マシンラーニングをスピードアップします。これまでディープラーニングでやってきたように、マシンラーニングをターボチャージしています」

RAPIDS は、GPU でアクセラレートした分析やマシンラーニングに、さらにデータ可視化にも、一連のオープンソース ライブラリを提供します。NVIDIA のエンジニアが主要なオープンソース提供者としっかりと協力しあい、この 2 年間で開発してきました。

サイエンティストが GPU 上でデータ分析パイプラインをすべて実行するために必要なツールとしては、これが初めてのものです。NVIDIA DGX-2™ システムでのトレーニング用に XGBoost マシンラーニング アルゴリズムを使用した初期の RAPIDS ベンチマークでは、CPU のみのシステムと比較して 50 倍もスピードアップしました。これにより、データサイエンティストはデータセットのサイズによって何日間もかかっていたトレーニング時間を数時間に、あるいは数時間を数分にまで、削減することができます。

オープンソース コミュニティとの密な連携
RAPIDS は、Apache Arrowや pandas、scikit-learn などを含む一般的なオープンソース プロジェクト上で、最も一般的な Python データ分析ツールチェーンに GPU アクセラレーションを追加することで構築されます。RAPIDS にマシンラーニング ライブラリや機能を追加するため、Anaconda、BlazingDB、Databricks、Quansight、scikit-learn といったオープンソース エコシステム提供者のほか、Ursa Labs 代表でありApache Arrow および pandas、さらには急成長中の Python データ分析ライブラリを生んだウェス マッキニー (Wes McKinney) 氏の協力を得ています。

マッキニー氏は次のように述べています。「GPU でアクセラレートしたデータ分析プラットフォームであるRAPIDS は、Apache Arrow で強化された次世代コンピュテーショナル エコシステムです。NVIDIA と Ursa Labs が協力することで、コアとなる Arrow ライブラリのイノベーションのペースが加速し、分析とパフォーマンスに大きな飛躍をもたらし、エンジニアリングの作業量に重要な意味を持つようになるでしょう」

 幅広い採用を目的として、NVIDIA は、RAPIDS を解析およびデータ分析用としてオープンソース フレームワークをリードするApache Arrow Spark に統合する予定です。

 Databricks 共同設立者兼チーフ テクノロジストであり、Apache Spark の創立者でもあるマテイ ザハリア (Matei Zaharia) 氏は次のように述べています。「Databricks では、Apache Spark のワークロードを加速する RAPIDS の可能性にとても期待しています。現在、Spark をネイティブのアクセラレータとよりよく統合するための進行中のプロジェクトが複数あり、Apache Arrow のサポートや、Project Hydrogen との GPU スケジューリングも含まれています。RAPIDS は、顧客のデータ分析および AIワークロードを拡大するための新しい機会だと信じています」

幅広いエコシステムサポートと採用
さまざまな業界にまたがってテクノロジを牽引する企業が、早くも NVIDIA の GPU アクセラレーション プラットフォームおよび RAPIDS を取り入れています。

Walmart、エグゼクティブ バイスプレジデント兼最高技術責任者、ジェレミー キング (Jeremy King) 氏は次のように述べています。「NVIDIA の RAPIDS ソフトウェアを搭載した GPU アクセラレーション プラットフォームがデータの使い方を大きく向上させてくれたので、もっとも複雑なモデルを、規模を拡大して実行し、より一層正確な予測ができるようになりました。RAPIDS はNVIDIA とWalmart のエンジニアとの深い協力にあり、これからもこの関係を発展させていく予定です」

さらに、世界の主要なテクノロジ企業が、新しいシステムやデータ分析プラットフォーム、ソフトウェア ソリューションを通じて RAPIDS をサポートしています。

「HPE は顧客の暮らしと仕事のあり方を向上させることに全力をあげています。人工知能、解析およびマシンラーニング テクノロジは、顧客が画期的な成果を達成しこの世界をよくするのに役立つ知見を見いだすことに重要な役割を担うことができます。HPE は市場で個性を放っています。私たちはそこで、戦略的なアドバイスから目的に応じた GPU アクセラレータ テクノロジ、運用サポート、強力なパートナー エコシステムにいたるまで、完全な AI およびデータ解析ソリューションを提供することで、顧客それぞれに最適なソリューションを調整しています。NVIDIA との協力で、RAPIDS によってデータ分析およびマシンラーニングの応用に弾みをつけ、顧客がより速くより洞察に満ちた成果を得られるようにしていきます」
 —Hewlett Packard Enterprise、CEO、アントニオ ネリ (Antonio Neri) 氏

 「IBM は、デプロイメント モデルにかかわらず、世界をリードするプラットフォームを企業 AI 向けに構築してきました。NVIDIA との良好なパートナーシップを拡大し、RAPIDS を活用して新たなマシンラーニング ツールを当社顧客に提供できることを楽しみにしています」
— IBM Research、ハイブリッドクラウド担当シニアバイスプレジデント兼ディレクター、アーヴィンド クリシュナ (Arvind Krishna) 氏

「昨今のコンピューティングの世界には、データ分析や解析と言った複雑な作業をこなすための強力な処理が求められています。これこそ NVIDIA の GPU が得意とするところです。RAPIDS は、このような処理およびマシーンラーニングのトレーニングに必要とするスピードを加速しています。Oracle Cloud Infrastructure に根ざした新しい一連のオープンソース  ソフトウェアをサポートできることをうれしく思い、また Oracle Data Science Cloud を含む当社のプラットフォーム全体で RAPIDS をサポートすることで、NVIDIA と協力して、顧客のエンドツーエンドなデータサイエンス ワークフローをさらに加速できることを楽しみにしています。RAPIDS のソフトウェアは Oracle Cloud 上でシームレスに実行され、顧客それぞれの HPC や AI、データサイエンス需要をすべてサポート可能にし、しかも Oracle Cloud Infrastructure 上で利用可能な GPU インスタンスのポートフォリオというメリットもついてくるのです」
— Oracle Cloud Infrastructure、ソフトウェア開発担当シニアバイスプレジデント、クレイ・マゴイアック (Clay Magouyrk) 氏

その他のイノベーター――Cisco、Dell EMC、Lenovo、NERSC、NetApp、Pure Storage、SAPおよびSAS、その他さまざまなデータサイエンスのパイオニア――からもサポートされています。

ご利用について
RAPIDS オープンソースの一連のライブラリへのアクセスは、http://www.rapids.aiからすぐに利用可能です。コードは Apache ライセンスのもとでリリースされています。RAPIDS のコンテナ バージョンは、NVIDIA GPU クラウド コンテナ レジストリで今週から利用可能になります。

 
このプレスリリースには、メディア関係者向けの情報があります。

メディア会員登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。
※内容はプレスリリースにより異なります。

  1. プレスリリース >
  2. NVIDIA >
  3. NVIDIA、大規模データ分析およびマシンラーニング向けオープンソースGPUアクセラレーション プラットフォームのRAPIDSを公開