オープンソースETL『Embulk』とCData JDBC Drivers の併用で250種類以上のSaaS・DWH 連携が可能に

~HubSpot、Dynamics 365、SAP、NetSuite、SharePoint、Jira、Backlog などのSaaS/NoSQL をEmbulk でコネクタ利用~

2021年3月3日、リアルタイムデータ連携のための標準ドライバーのリーディングプロバイダーであるCData Software(本社:アメリカノースカロライナ州、日本オフィス:宮城県仙台市、代表社員 職務執行者 疋田 圭介、以下CData)は、オープンソースETL 『Embulk』におけるCData JDBC Drivers の検証を行い、250種類以上のSaaS/NoSQL がEmbulk でコネクタとして利用可能になりました。


企業が取り組んでいるDX(デジタルトランスフォーメーション)にはデータ活用が欠かせません。Embulk は、ログファイルやCSV ファイルなどの大量データをバルクで各種RDB、クラウドデータストア、DWH にロードできるオープンソースETL ツールとして注目を集めています。特徴的な点として、Embulk はPlugin モデルを採用しており、多様なファイル種類、DB、スト―レージ、RDB、DWH に対するPlugin を使ってInput とOutput 処理を簡単に組むことが可能です。

しかし、昨今企業では多くのSaaS やNoSQL を活用しており、Embulk のPlugin が提供されていないものも多く、ユーザーはクラウドデータの連携のためにはAPI コーディングを行う必要がありました。今回の検証により、250 種類以上のクラウドデータに連携するCData JDBC Drivers がEmbulk で利用可能になりました。Embulk が提供するJDBC Input Plugin とCData JDBC Drivers を併用することで、使い慣れたSQL で各種SaaS、NoSQL データをGoogle BigQuery、Amazon S3、Redshift などに連携することができます。

これにより、Embulk のパワフルなバルク機能を使って、CSV やRDB データだけでなく、SaaS やNoSQL データを包括するデータ基盤の構築が簡単に実現できます。企業で利用するあらゆるデータを効率的に、分析・ビジュアライズすることでDX を加速させます。


<Embulk でのCData JDBC Drivers の利用方法>

  1. Embulk でJDBC Input Plugin をインストール
  2. CData JDBC Drivers をEmbulk 環境にインストール
  3. Config ファイルを作成して、JDBC Driver とSaaS との接続を確立し、Input とOutput の内容を設定(画像はkintone Driver)

<CData JDBC Drivers の主要機能>
CData JDBC Drivers は、それぞれのSaaS API をテーブルに仮想化しSQL インターフェースでのアクセスを実現するとともに、高いパフォーマンスを発揮します:
  • JDBC Type 4/5 準拠:Java アーキテクチャ完全準拠で、クライアント側のライブラリに依存しないネイティブプロトコルを実現
  • メタデータ検出:インテリジェントな行スキャン、データ型検出、リレーション検出、非構造化データのフラット化
  • 強力なSQL-92 エンジン:高機能SQL-92 エンジンにより、バルク処理、プッシュダウン、クライアントサイド関数、集計を実現
  • ハイパフォーマンス:ソケットレベルから最適化されたパフォーマンス
  • 動的スキーマ:Salesforce、kintone、Dynamics 365、NetSuite などのカスタムオブジェクトにも動的に対応。さらに子テーブルやサブテーブルにも対応し、リレーショナルデータベースと同じ操作感を実現

<Embulk でCData JDBC Drivers を活用>
ETL/ELT のEmbulk を使って各種SaaS データをロードする方法のサンプル記事は以下です。
<CData JDBC Drivers の主要SaaS、DB データソース>
CData では、グローバルのSaaS のみならず日本国内のクラウドデータにも幅広く対応しています。詳細はCData JDBC Drivers ページ(https://www.cdata.com/jp/jdbc/)を参照してください。
CRM:Salesforce、Dynamics 365、HubSpot、eセールスマネージャー、PCA 商魂商管、Oracle Sales Cloud、SAP Hybris ほか
ERP・会計:SAP、SAP Business One、SAP Netweaver Gateway、SAP Concur、Dynamics 365 Business Central、NetSuite、Dynamics NAV、スマレジ、QuickBooks Online ほか
マーケティング:Marketo、Oracle Eloqua、Salesforce Pardot、Google Ads、Google Analytics、Shopify ほか
グループウェア・コラボレーション:SharePoint、Jira、ServiceNow、Garoon、Smartsheet、Backlog ほか
データベース:Amazon Athena、Amazon DynamoDB、Google BigQuery、SQL Server、SAP HANA、Cassandra、Cloudant、Cosmos DB、MongoDB、Snowflake、Couchbase、Elasticsearch、MarkLogic、Google Spanner、HBase、Hive、Splunk、OData ほか

<CData Software について>
CData Software, Inc. は、See the World as a Database をミッションに、データ接続および連携ソリューションを提供しています。ドライバーとデータ接続テクノロジーの開発に特化し、お客様のオンプレミスおよびクラウドアプリケーション、データベース、Web API へのリアルタイム接続を実現いたします。CData 製品は、世界中の大手企業、中小企業、政府機関、教育機関のデータ統合ソリューションにて利用されています。

※本リリースに掲載する社名または製品名は、各社の商標または登録商標です。

<本件に関するお問い合わせ先>
CData Software Japan 合同会社 マーケティング 兵藤
E-mail: press@cdata.co.jp
  1. プレスリリース >
  2. CData >
  3. オープンソースETL『Embulk』とCData JDBC Drivers の併用で250種類以上のSaaS・DWH 連携が可能に