FastLabel、NABLAS株式会社へ大規模視覚言語モデル開発に必要な独自データを作成し提供

日本の食品・流通小売業界に特化した生成AIモデルにおけるGENIAC第2期の採択を支援

FastLabel

Data-centric AI[※1]開発に必要なデータ収集・生成からアノテーション、モデル開発、DataOps構築までの全工程を支援するFastLabel株式会社(本社:東京都新宿区、代表取締役CEO:鈴木健史、以下「当社」)は、AI総合研究所として活動するNABLAS株式会社 (本社 : 東京都文京区本郷、 代表取締役 所長 : 中山浩太郎、 以下「NABLAS」)へ、大規模視覚言語モデル開発に必要な独自のInstruction Tuningデータ[※2]を作成し提供したことをお知らせします。

[※1] Data-centric AI:AIのデータセットを改善することでモデルの精度改善を実現するアプローチ

[※2] Instruction Tuningデータ:AIモデルに指示と回答のデータセットを学習させる技術におけるデータ

今回の当社のデータ作成と提供は、NABLASによる日本の食品・流通小売業界への推進を見据えた大規模視覚言語モデル開発に活用され、経済産業省・NEDOが推進する国内生成AI開発プロジェクト(以下、GENIAC)[※3]」の第2期(2024年10月発表[※4])の採択も支援しています。

[※3]GENIAC: 経済産業省が2024年2月に立ち上げた国内の生成AI開発力強化プロジェクト

 [※4]NABLASの発表:https://www.nablas.com/post/geniac-20241011

【日本の生成AIモデル開発におけるデータの課題

日本の生成AIモデル開発におけるデータは量と質において以下の課題があります。

量の課題:日本語は英語に比べて主要なサイトなどにおけるインターネット上の公開データが少なく、大規模な学習データを確保しにくいといった背景があります。

質の課題:日本語データの多くはニュース記事やWikipediaなどに偏りがちで、カジュアルな口語表現や、最新の流行語、ネットスラング、SNSの会話データなどの情報が不足しています。

【当社の支援内容

課題を踏まえ、今回当社ではNABLASへ以下の支援を行いました。

Instruction Tuningデータ作成:日本国内で流行した食品の情報をSNSから収集するために収集データの要件を整理し、要件をもとに大規模データをSNSより収集した上で指示文と回答文を作成。

GENIAC要件への対応と採択支援コンサルティング:GENIACにおける当社の豊富な採択支援実績に基づいたコンサルティングを提供し、審査基準を満たす生成AIモデル開発の企画を支援。

【NABLAS  R&D事業部 リード・リサーチエンジニア 新立様より本支援に関する所感】

この度は、「流行食」に特化した大規模モデル開発プロジェクトにおけるデータセット作成を依頼しました。多岐にわたるユニークなタスク設定をしていたのでデータのアノテーションにおける精度に課題がありましたが、綿密な打ち合わせによる課題感のすり合わせとアノテーション例の複数回の確認により、こちらの想定していた通りの高品質なデータセットを作成することができて助かりました。今後はこのデータセットを用いて作成した大規模モデルをもとに、「食x生成AI」という新規性の高いサービスの展開を進めていきます。

【今後の展望
当社は、創業以来、AI開発におけるデータに関するあらゆる課題を解決するソリューションを提供しています。「AIインフラを創造し日本を再び世界レベルへ」というパーパスを掲げ、昨今急速に加速する生成AIの技術革新の流れの中、モデル開発におけるデータ構築の領域でエンタープライズ企業様を中心に下支えして参りました。今回のNABLASへの支援は、生成AI領域におけるパーパス実現に向けた重要な一歩であり、日本国内外で持続可能な社会インフラとしての生成AI技術の開発及び定着を下支えすることを引き続き目指してまいります。

【当社事業について】
当社は「データセット提供」、「アノテーション代行」、「モデル開発支援」、「FastLabel Data Factory」など、AI開発を行うお客様に向けたトータルソリューションを提供しています。

データセット提供:権利クリアかつ高品質な各種データの収集、販売を行います。ストックの提供や新規撮り下ろしにも対応しています。

アノテーション代行:あらゆる非構造化データに対応し、弊社独自の品質管理によりデリバリー品質を担保しています。ドメイン知識が必要な仕様にも対応可能です。

モデル開発支援:画像や動画の撮影条件や正確性/統一性を読み解きながらモデルの学習・評価を実施し、評価結果を精度向上につなげていきます。

FastLabel Data Factory:データ収集・管理、アノテーション、モデル開発までワンストップで提供するSaaSです。DataOps構築を実現し教師データ準備を大幅に効率化できます。

当社は各業界リーディング企業への豊富な支援実績を有し、権利クリアかつ高品質なデータ作成に強みを置いております。豊富な経験を通して培ったアノテーション仕様作成をはじめとしたAI開発のノウハウで、今後も多くのお客様を支援してまいります。

【当社の概要について】

社名:FastLabel株式会社

代表者:代表取締役CEO 鈴木健史

事業内容:Data-centric AI開発を支援するプロフェッショナルサービスとプロダクトの提供

設立:2020年1月23日

本社所在地:〒163-0224 東京都新宿区西新宿2-6-1  新宿住友ビル24階

URL:https://fastlabel.ai/

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


会社概要

FastLabel株式会社

29フォロワー

RSS
URL
https://fastlabel.ai/
業種
情報通信
本社所在地
東京都新宿区西新宿2-6-1 新宿住友ビル24階
電話番号
-
代表者名
鈴木健史
上場
未上場
資本金
1億円
設立
2020年01月