GRI社、クラウド型ELTツールMatillionを利用したデータ分析基盤の導入支援サービスの強化により、AI、BI、及びDXの推進を加速化します
*ELTツールとは、組織の内外に散在するデータを抽出・収集(Extract)し、特定の格納先に情報として配信・送出(Load)したのちに、目的に応じてデータを変換・加工(Transform)するツール
AI(人工知能)、BI(ビジネスインテリジェンス)、及びDX(デジタルトランスフォーメーション)におけるデータ利活用は、企業が事業を効率化するための欠かせないものになっています。しかしながら、データ分析ができるデータエンジニアが圧倒的に不足しているのが現状です。データエンジニアは、従来のソフトウェアエンジニアと異なる知識を必要とされ、特に大規模データを効率的に分析するためのデータ整備のスキルを習得している必要があります。このデータエンジニアの確保には時間を要するため、データ分析基盤の構築と運用を簡易化するクラウド型ELTツールであるMatillionを利用して、データ分析基盤の導入を加速化する事例が増えています。
Matillionを利用すると、コンポーネントを設定するだけで、非エンジニアでもグラフィカルな表現でシステム連携の設定が可能になります。この設定手順により、複雑な処理を組織内で共通理解しやすくするだけでなく、不要なエンジニア工数を大幅削減することができます。図1は分析用のデータベース(BigQuery)から弊社の自動機械学習ツール(ForecastFlow™)とBIツールへの自動連携を設定した例で、AIとBIのデータ自動更新を簡単に設定できます。
GRI社は、Matillionの導入支援により企業のDX推進を加速化します。
図1:分析用データベースのBigQuery、Pythonコマンド、自動機械学習ツールのForecastFlow™、BIツールTableauの連携例
【Matillionを利用したデータ分析基盤の導入・運用のメリット】
- 大規模データ分析用クラウド型データベースに対応: 大規模データ分析用クラウド型データベース(メジャーなサービスであるGoogle Cloud PlatformのBigQuery, AWSのRedshift, Snowflake, 及びMicrosoft AzureのSynapse)を非エンジニアが効率的に利用するためのツールです。ノンプログラミングでこれらのデータベースの有効活用を実現します。
- データ分析基盤へのデータ統合の高速化: 企業内外に散逸しているデータを最短5分でクラウド型データベースに統合できます。これは、Matillionが目的に沿った形でコンポーネントを用意しており、このコンポーネントを選択し、項目内に必要事項を記述するだけで設定が完了するためです(図2と図3を参照)。従来型のデータ統合ではシステムエンジニアが、要件定義・概要設計・詳細設計・テスト・デプロイの各ステップでプログラミングにより実装していました。しかし、Matillionを利用することでこれらのステップのほぼ全てが不要になります。また、これらのコンポーネントは典型的な入力データである80種類を超すクラウドサービス、データベース、ファイルに対応しています。
- ドキュメント作成の簡素化:従来型のデータ統合では、要件定義・概要設計・詳細設計・テスト・デプロイの各ステップで異なる担当者が作業をするため、膨大なドキュメントによる伝言ゲーム上の間違いを防止する必要がありました。Matillionでは上記のステップが不要なため、Matillionに記述されている最低限の内容そのものがドキュメントとして成立し、不要なドキュメント作成の時間を節約できます。
- 複雑なデータフローを可視化: データ分析基盤の利用が進むと、DWH(データウェアハウス)やDM(データマート)が複雑化し、従来のSQL文だけによる運用は、作成者以外は分からない属人化の罠に陥ってしまいがちです。Matillionはデータフローを可視化した形で表現するため、データパイプラインを初見の担当者でも理解しやすくなり、運用時の変更対応を容易にします。
- 大規模なデータ整形処理を高速化: Matillionはグラフィカルに記述されたデータパイプラインからSQLを自動生成し(図4を参照)、大規模データ分析用クラウド型データベースに処理を任せるため、大規模データの高速処理を実現できます。従来のETLツールは、データ整形処理を行うためにデータベースからデータを出力し、ローカルマシーン上でデータ整形処理を行う必要があり、大規模データを扱うことが困難でした。
- 安定的なジョブ管理と効率化: データ分析基盤の様々な自動実行ジョブをGUIベースで効率的に管理できるため、複雑化するジョブ(エラー時の処理対応、ジョブ同士の前後の依存関係、複雑なパラメータ、PythonやLinuxコマンドの利用など)を効率的に管理できます。
図2:入力データとしてのGoogle AdWordsコンポーネントを選択した例
図3:Google AdWordsコンポーネントの項目の例
図4:グラフィカルなデータパイプラインをコンポーネント選択により記述すると、Matillion側でSQL文が自動生成される
Matillion社について https://www.matillion.com/
Matillion社の基本的な信念は:
- すべてのビジネスはデータを使って競争する必要があります
- データの量と複雑さ、そして処理するために必要なスピードと規模を考えると、効果的に(かつコスト効率よく)競争できるのはクラウドだけです
- クラウドでは、データを最大限に活用しインサイトまでの時間を短縮するためには、3つの要素が必要です
- データ-全てのデータ
- クラウド型データウェアハウス
- データをクラウドのデータウェアハウスへ投入し、アナリティクスに役立つように変換する方法
GRI社について https://gri.jp/
データで新たな事業を開発していくカンパニー。
データを利活用した事業開発に関わる支援をはじめとして、自社開発のセルフ型自動機械学習ツール「ForecastFlow™」や、「Matillion」の導入支援サービスなど、事業や課題にあったサービスを提案します
ForecastFlow™について https://ForecastFlow.jp/
”予測で世界は変えられる”
データに基づく戦略的な施策立案をサポートするセルフ型自動機械学習ツール
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像