データの前処理ゼロへ。分析者のための加工済みオープンデータをクラウド共有。
株式会社truestar(本社:東京都渋谷区、代表取締役社長:藤 俊久仁、以下truestar)は、データ分析者が即座に分析に取り組めるように加工したオープンデータをデータ代無料で共有するサービス「Prepper Open Data Bank」を、2021年7月30日より開始致します。
データ分析のボトルネックである “データプレパレーション”
昨今の技術革新により、RPA(Robotic Process Automation)、MA(Marketing Automation)、BI(Business Intelligence)ツールにとどまらず、AIや機械学習をノーコードで行える分析ツールも数多く存在するようになりました。もはやデータ分析は一部のデータサイエンティストだけが行う業務ではありません。
これらのツールに不可欠であるデータに関しては、公的な人口統計などの他、オルタナティブデータと呼ばれる外部調査データ、twitterなどのSNSデータ、IOT端末から取得されるデータなど、自社のPOSデータや顧客データ以外にも比較的簡単に入手できるようになってきています。
その一方で、近年は『データ分析の8割は前処理』といったフレーズを日本でも見聞きすることが増えました。データの前処理(データプレパレーション)がデータ分析の課題として顕在化し、分析者の負担になっているのです。有償か無償かを問わず、多くのデータにおいて、分析を行うための前処理としてデータの抽出・変換・加工・書き出し(いわゆる『ETL』)を求められ、本来行うべきデータ分析に入るまでに何時間も費やしているのが実状です。
前処理の例
- ウェブサイトからCSVで多数のファイルをダウンロード
- メールで送られてきたパスワード付のZipファイルの解凍
- APIの仕様やデータの定義を確認・理解
- 不要なヘッダ行、使わない行(総計や小計など)や列の削除
- 分析基盤のDWHにアップロード
- データ更新時のデータ入れ替え
データ分析者の後方支援サービス『Prepper』
truestarは創業以来、データ分析やBIツールの実装を国内外合わせて延べ50社以上に提供しており(※事業承継前の実績含む)、お客様に代わってデータ分析の前処理を日常的に実施しています。その中で蓄積された知見やスキルを活用し、データ分析者の後方支援のために展開しているサービスが『Prepper』です。
様々なデータと様々なデータ分析ソリューションをシームレスにつないだデータ分析エコシステムを構築するには、正確でわかりやすく、すぐに使えるデータが求められます。truestarは複数のデータプロバイダーとのパートナーシップを軸に、分析者にとって最適な形でのデータ提供を目指しています。
Prepper Open Data Bankはデータ分析者ためのオープンデータ共有サービス
今回はその取り組みの一つとして、オープンデータに特化した『Prepper Open Data Bank』をローンチ致しました。
国内のオープンデータとして有名な政府統計の総合窓口e-Statでは、国勢調査、人口推計、消費動向調査、犯罪統計など673調査155万超のデータセットが公開されています(2021年7月時点)。ビジネスにおいて有益なデータセットも多数ありますが、データの共有形式はAPI、Excel、CSV、PDFなど様々ですぐにデータ分析できる形では提供されていないものも多く、利用の際には分析者が前処理を余儀なくされます。
truestarはその課題を解決すべく、商用・二次利用可能なオープンデータを前処理不要ですぐに分析できるよう抽出・加工し、クラウド上でデータ代無料にて共有することに致しました。
公開第一弾は国勢調査の加工データ
第一弾として、国勢調査の社会・人口統計と国土数値情報の行政区域のデータを対象に、都道府県、市区町村、町丁目のそれぞれの粒度で分析できるよう抽出・加工・統合したデータを多数公開致しました。
Tableauを用いた可視化事例
対象データはSnowflakeデータマーケットプレイスにてデータ代無料共有
Prepper Open Data Bankで取り扱う加工済みのオープンデータは、スノーフレイク(所在地:東京都渋谷区、カントリーマネージャー:東條 英俊)が展開するグローバルなデータプラットフォーム「Snowflakeデータマーケットプレイス」で共有します。
SnowflakeはクラウドネイティブなDWH(データウェアハウス)であり、AWS、MS Azure、GCPといった特定のクラウドベンダーにロックインされず、いずれの環境からでもシームレスな接続が可能で、データ利用者にとって利便性が高い環境です。
Prepper Open Data BankではSnowflakeのグローバルで実績のあるデータ基盤を活用することで、高いセキュリティやスケーラブルな環境を保持したサービス提供とともに、TableauやAlteryxのようなデータ分析ツールとのシームレスな連携を実現します。
今後の展開
Prepper Open Data Bankでは、e-Statや国土数値情報のみならず、国内外の商用・二次利用可能なオープンデータのラインナップを拡充していきます。
また、今秋にはPrepper Data POIという、POI(Point of Interest:施設や商圏など関心のある位置情報)やそれに紐づけた統計データをお客様のビジネス環境にカスタマイズした分析用データセットを提供するサービスをローンチ予定です。
truestarでは、今後もデータ分析者を支援する取り組みを行ってまいります。
本件に関するお問い合わせ先
担当:小海老澤
連絡先:info@truestar.co.jp
株式会社truestar
URL:https://truestar.co.jp/
所在地:東京都渋谷区恵比寿1-19-19 恵比寿ビジネスタワー4F
代表者名:代表取締役社長 藤 俊久仁
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザーログイン既に登録済みの方はこちら
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像