データの前処理ゼロへ。分析者のための加工済みオープンデータをクラウド共有。

株式会社truestar

株式会社truestar(本社:東京都渋谷区、代表取締役社長:藤 俊久仁、以下truestar)は、データ分析者が即座に分析に取り組めるように加工したオープンデータをデータ代無料で共有するサービス「Prepper Open Data Bank」を、2021年7月30日より開始致します。

 


データ分析のボトルネックである “データプレパレーション”

昨今の技術革新により、RPA(Robotic Process Automation)、MA(Marketing Automation)、BI(Business Intelligence)ツールにとどまらず、AIや機械学習をノーコードで行える分析ツールも数多く存在するようになりました。もはやデータ分析は一部のデータサイエンティストだけが行う業務ではありません。

これらのツールに不可欠であるデータに関しては、公的な人口統計などの他、オルタナティブデータと呼ばれる外部調査データ、twitterなどのSNSデータ、IOT端末から取得されるデータなど、自社のPOSデータや顧客データ以外にも比較的簡単に入手できるようになってきています。

その一方で、近年は『データ分析の8割は前処理』といったフレーズを日本でも見聞きすることが増えました。データの前処理(データプレパレーション)がデータ分析の課題として顕在化し、分析者の負担になっているのです。有償か無償かを問わず、多くのデータにおいて、分析を行うための前処理としてデータの抽出・変換・加工・書き出し(いわゆる『ETL』)を求められ、本来行うべきデータ分析に入るまでに何時間も費やしているのが実状です。

前処理の例
  • ウェブサイトからCSVで多数のファイルをダウンロード
  • メールで送られてきたパスワード付のZipファイルの解凍
  • APIの仕様やデータの定義を確認・理解
  • 不要なヘッダ行、使わない行(総計や小計など)や列の削除
  • 分析基盤のDWHにアップロード
  • データ更新時のデータ入れ替え
など
 

 




データ分析者の後方支援サービス『Prepper』

truestarは創業以来、データ分析やBIツールの実装を国内外合わせて延べ50社以上に提供しており(※事業承継前の実績含む)、お客様に代わってデータ分析の前処理を日常的に実施しています。その中で蓄積された知見やスキルを活用し、データ分析者の後方支援のために展開しているサービスが『Prepper』です。

様々なデータと様々なデータ分析ソリューションをシームレスにつないだデータ分析エコシステムを構築するには、正確でわかりやすく、すぐに使えるデータが求められます。truestarは複数のデータプロバイダーとのパートナーシップを軸に、分析者にとって最適な形でのデータ提供を目指しています。
 

 






Prepper Open Data Bankはデータ分析者ためのオープンデータ共有サービス

今回はその取り組みの一つとして、オープンデータに特化した『Prepper Open Data Bank』をローンチ致しました。

国内のオープンデータとして有名な政府統計の総合窓口e-Statでは、国勢調査、人口推計、消費動向調査、犯罪統計など673調査155万超のデータセットが公開されています(2021年7月時点)。ビジネスにおいて有益なデータセットも多数ありますが、データの共有形式はAPI、Excel、CSV、PDFなど様々ですぐにデータ分析できる形では提供されていないものも多く、利用の際には分析者が前処理を余儀なくされます。

truestarはその課題を解決すべく、商用・二次利用可能なオープンデータを前処理不要ですぐに分析できるよう抽出・加工し、クラウド上でデータ代無料にて共有することに致しました。
 

 




公開第一弾は国勢調査の加工データ

第一弾として、国勢調査の社会・人口統計と国土数値情報の行政区域のデータを対象に、都道府県、市区町村、町丁目のそれぞれの粒度で分析できるよう抽出・加工・統合したデータを多数公開致しました。

Tableauを用いた可視化事例




対象データはSnowflakeデータマーケットプレイスにてデータ代無料共有

Prepper Open Data Bankで取り扱う加工済みのオープンデータは、スノーフレイク(所在地:東京都渋谷区、カントリーマネージャー:東條 英俊)が展開するグローバルなデータプラットフォーム「Snowflakeデータマーケットプレイス」で共有します。
SnowflakeはクラウドネイティブなDWH(データウェアハウス)であり、AWS、MS Azure、GCPといった特定のクラウドベンダーにロックインされず、いずれの環境からでもシームレスな接続が可能で、データ利用者にとって利便性が高い環境です。




Prepper Open Data BankではSnowflakeのグローバルで実績のあるデータ基盤を活用することで、高いセキュリティやスケーラブルな環境を保持したサービス提供とともに、TableauやAlteryxのようなデータ分析ツールとのシームレスな連携を実現します。

今後の展開

Prepper Open Data Bankでは、e-Statや国土数値情報のみならず、国内外の商用・二次利用可能なオープンデータのラインナップを拡充していきます。
また、今秋にはPrepper Data POIという、POI(Point of Interest:施設や商圏など関心のある位置情報)やそれに紐づけた統計データをお客様のビジネス環境にカスタマイズした分析用データセットを提供するサービスをローンチ予定です。

truestarでは、今後もデータ分析者を支援する取り組みを行ってまいります。



本件に関するお問い合わせ先
担当:小海老澤
連絡先:info@truestar.co.jp

株式会社truestar
URL:https://truestar.co.jp/
所在地:東京都渋谷区恵比寿1-19-19 恵比寿ビジネスタワー4F
代表者名:代表取締役社長 藤 俊久仁

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


会社概要

株式会社truestar

3フォロワー

RSS
URL
https://www.truestar.co.jp/
業種
サービス業
本社所在地
東京都渋谷区道玄坂1-16-3 渋谷センタープレイス 8F
電話番号
-
代表者名
藤 俊久仁
上場
未上場
資本金
-
設立
2015年05月