『AI開発における画像・動画データ活用実態調査2025』発表

オープンデータでは9割が日本特有データに不足感、自社撮影も質への課題が浮き彫りに

ピクスタ

ピクスタ株式会社(東京都渋谷区 代表取締役社長:古俣大介、東証グロース:3416)が運営する写真・イラスト・動画・音楽素材のマーケットプレイス「PIXTA(ピクスタ)」は、「機械学習用画像・動画データ提供サービス」として、『AI開発における画像・動画データ活用実態調査2025』を実施いたしました。


2024年12月に発表した「データ収集実態調査」で調達方法として主流のオープンデータや自社で調達したデータに、どのような課題や認識があるのかを明らかにいたしました。

◆ PIXTA機械学習用画像・動画データ提供サービス:https://pixta.jp/machinelearning-dataset

■ 調査結果サマリ

・オープンデータセットの利用動機は「無料・低コスト」が75.2%で最多

・オープンデータセットの課題は「データの偏り」、日本特有データの不足を9割が実感

・画像・動画データを自社で撮影する理由は、オープンデータの補完

・データの自社撮影は「費用と時間」、「バリエーション」の確保が課題

・撮影協力者は社員が約8割だが属性の偏りに課題、約9割が必要な表情や行動表現に悩み

・機械学習用データセットを購入・検討する人も9割超。質と量、商用利用可能が鍵

<調査概要>

調査名:AI開発における画像・動画データ活用実態調査2025

調査期間:2025年03月14日~2025年3月15日

調査方法:インターネットリサーチ

回答人数総数:226名

2024年12月にPIXTAが発表した「AI開発における画像・動画データ収集実態調査2024」では、主な画像・動画データ収集方法は「オープンデータの活用」と「自社で調達」でした。そこで、この度の調査では、オープンデータを利用する理由と課題、自社調達(自社で撮影)する理由と課題を、それぞれ聞きました。

■ オープンデータセットの利用動機は「無料・低コスト」が75.2%で最多

AI開発・研究において、画像・動画データの収集に「オープンデータセット」を活用していると回答した226名に理由を尋ねたところ、最も多い回答は「無料または低コストで利用できる」(75.2%)でした。次いで「必要な条件を満たしたデータを入手できる」(73.9%)、「充分な量のデータを入手できる」(63.7%)が、オープンデータ活用の動機になっていることがわかります。

低コストで充分な量の必要な条件のデータを活用できることが、オープンデータ活用の大きなメリットになっていると言えます。

■ オープンデータセットの課題は「データの偏り」、日本特有データの不足を9割が実感

一方、オープンデータセットの画像・動画データの課題について尋ねると、「データの内容に偏りがある」(65.5%)が最も多く、「希望する条件に合うデータがない」(57.5%)、「データが古く、最新の環境を反映していない」(50.0%)など、データの内容に関する項目が目立ちました。

前問でオープンデータセット活用の理由として「必要な条件を満たしたデータが入手できる」と回答した人も、データ内容に関する課題を挙げていることから、「無料または低価格で入手可能」なデータとしては充分役割を果たしているが、AI開発や研究において真に必要なデータとしては充分ではないことがうかがえます。

さらに、オープンデータでは日本特有の画像・動画データ(日本人、風景、文化、風習など)の不足が課題だと感じたことがあるかを尋ねると、「課題だと思う(58.4%)」「どちらかというと課題に思う(38.4%)」という結果となり、9割以上が日本特有のデータの不足に関して課題と感じていることが判明しました。

■ 画像・動画データを自社で撮影する理由は、オープンデータの補完

AI開発における画像・動画データの調達方法として、オープンデータの活用に次いで多かった「自社で調達」についても、理由や課題を調査いたしました。


AI開発用データとして勤め先で画像・動画データを撮影する理由を尋ねたところ、最多は「オープンデータではデータの質が不十分だから」(62.8%)で、次いで、「必要なデータがオープンデータにはないから」(56.6%)、「オープンデータではデータの量が不十分だから(51.8%)」が挙がりました。

撮影する最も大きな理由を尋ねたところ「必要なデータがオープンデータにはないから」(28.7%)、「オープンデータではデータの質が不十分だから」(26.5%)の2項目がそれぞれ全体の3割近くを占めていることからも、オープンデータを活用した上で、不足を補う次の手として、自分たちで撮影するという手段を取っていることがわかります。

■ データの自社撮影は「費用と時間」、「バリエーション」の確保が課題

一方で、勤め先で撮影する課題を伺ったところ、最も多かったのは「撮影の準備(機材·環境·被写体など必要なものの手配等)に時間がかかる」(66.4%)で、僅差で「撮影の準備(機材·環境·被写体など必要なものの手配等)に費用がかかる」(63.3%)が並んでいます。次いで「必要なバリエーション(環境・天候・季節・被写体など)を揃えるのが難しい」(58.4%)が多いことがわかりました。

■ 撮影協力者は社員が約8割だが属性の偏りに課題、約9割が必要な表情や行動表現に悩み

人物を被写体とした画像・動画データが必要な場合、誰に協力を求めているかを尋ねたところ、最も多かったのは「社内の従業員」(76.1%)で、次いで「顧客やパートナー企業」(67.3%)でした。モデル事務所やキャスティングサービスのモデルへの依頼は3割強に留まり、自社および関係者に撮影協力を依頼するのが主流であることがわかります。

そこで、撮影協力者の属性に関する課題を感じたことはあるかを尋ねると「年齢層に偏りがある」(61.6%)が最も多く、「条件に合致する身体的特徴をもつ撮影協力者を確保しにくい」(58.8%)、「性別に偏りがある」(57.9%)が僅差で並ぶ結果となりました。

高齢者や子ども、身体障がい者などは従業員の協力だけでは撮影するのは難しく、男女比に偏りがある業界では、男性または女性のデータが不足する事態も想像に難くありません。

また、「当日の衣装の指定が難しい」が4割を超え、実際に撮影する段階で盲点になりがちな「衣装」の問題も課題として挙がることがわかりました。


さらに、撮影協力者の表情や行動・動作について課題を感じたことがあるかを問うと、「ある」(52.8%)、「どちらかというとある」(37.5%)という結果となり、9割以上が課題に感じていることがわかります。

従業員や関係者は撮影に不慣れな場合が多く、意図した表情、行動、動作の撮影の難易度が高いことがうかがえます。

■ 機械学習用データセットを購入・検討する人も9割超。質と量、商用利用可能が鍵

これまでに、外部業者から機械学習用の画像や動画のデータセットを購入したことはあるか尋ねたところ、「ある」が62.0%、「ないが、業者に問い合わせるなどして検討した」が34.1%でした。

データの購入・検討理由は「オープンデータではデータの質が不十分だから」(64.1%)が最も多く、次いで「オープンデータでは商用利用できないから」(55.3%)、「オープンデータではデータの量が不十分だから」(51.2%)、「自社で撮影すると時間がかかるから」(41.5%)が挙がりました。

データの質と量の課題を解決することや、商品・製品化を前提とした「商用利用可能なデータ」の入手先として、外部業者からのデータ購入が選択されていることがわかります。

データセットを購入する際に特に重要視するポイントは「必要なデータ(対象物・シナリオ)が揃っていること」(45.2%)が最多で、次点の「価格」(44.7%)よりも、データの条件が重要視されていることがわかります。次に「商用利用可能なライセンス」(42.9%)、「アノテーションの精度・統一性」(41.0%)が続き、商品・製品・サービス化にあたり、AI倫理に基づいたクリーンな学習データであることを重要視していることもわかりました。

■ 調査を終えて〜オープンデータと自社撮影の不足を補い、製品化の道を開くデータセット〜

前回および今回の調査で、オープンデータを活用し、その不足を補うために自社で撮影することでAI開発に必要な画像・動画データを調達しているものの、それぞれに質や多様性の確保など、様々な課題があることがわかりました。

これらの課題を解決するのが、PIXTAの機械学習用 画像・動画データ提供サービスです。

PIXTAは、商用利用可能な日本人を含む日本特有の豊富な画像群を強みに持つAIデータセットライセンス提供サービスです。約1億点の予め撮影された画像・動画データの中から開発条件に合ったデータを提供するだけでなく、AI開発・研究者の要件に合わせた撮影の請負も可能。PIXTAが独自に築いてきた多様性と表現力を兼ね備えたモデルネットワークと、豊富な経験で服装を含めて適切な指示のもと、権利処理を含めて効率よく撮影していくことで、自社撮影に起こりがちな課題も解消。時間や費用を抑えつつ、質と量の課題も解決できます。

PIXTAでは調査で明らかになった課題を解消する術として、今後もニーズの高い様々なデータセットを商品化するとともに、柔軟なキャスティングと撮影サービスを通じて、AI開発に取り組む企業の皆様を支援し、国内のAI開発の発展に貢献してまいります。

■ PIXTA機械学習用画像・動画データ提供サービスについて

PIXTAの「機械学習用データ提供サービス」は、国内最大級のストックフォトサイトである強みを活かし、1億点以上の商用利用できる画像・動画・音声データを機械学習の用途・要件に合わせて提供するものです。

オープンデータだけでは入手しづらい豊富な日本人画像ライブラリと、機械学習専任チームによる高度なアノテーション技術で、一気通貫でデータ収集できること強みに、画像認識AI・物体検知AI等の開発に注力する自動車・製造業界大手はじめ様々な企業から高い支持を得ています。

◆ PIXTA機械学習用画像・動画データ提供サービス:https://pixta.jp/machinelearning-dataset

◆ note(PIXTA機械学習データサービス):https://note.com/pixta_ml/

また、PIXTAの撮影サービス各種と連携し、学習データの撮り下ろしにも対応。フォトグラファーの手配はもちろん、モデル・ロケーションの手配から、撮影ディレクションまで、必要なシチュエーションの画像・動画データを撮影し提供いたします。

◆ 全国出張料無料のカメラマン手配「PIXTAオンデマンド」:https://od.pixta.jp/

◆ 完全オーダーメイドビジュアル制作「PIXTAカスタム」:https://pixta.jp/custom

◆ 老若男女のモデル手配「PIXTAキャスティング」:https://pixta.jp/pixta-casting

【会社概要】

ピクスタ株式会社 (東証グロース:3416)

設 立:2005年8月25日

所在地:東京都渋谷区渋谷2丁目21−1 渋谷ヒカリエ 33階 JustCo Shibuya Hikarie

TEL:03-5774-2692

資本金:332,437千円(2024年12月末時点)

代表取締役社長:古俣 大介

URL:https://pixta.co.jp/

事業内容:デジタル素材のオンラインマーケットプレイス「PIXTA」の運営、

     法人向け出張撮影・カメラマンサービス「PIXTAオンデマンド」の運営、

     出張撮影プラットフォーム「fotowa」の運営

子会社:PIXTA ASIA PTE. LTD.

    PIXTA VIETNAM CO., LTD.

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

ピクスタ株式会社

42フォロワー

RSS
URL
http://pixta.co.jp/
業種
商業(卸売業、小売業)
本社所在地
東京都渋谷区渋谷2丁目21−1 渋谷ヒカリエ 33階 JustCo Shibuya Hikarie
電話番号
03-5774-2692
代表者名
古俣 大介
上場
東証グロース
資本金
3億3243万円
設立
2005年08月