Qlean Dataset、「感情を込めた発話データセット」の提供を開始
~GENIAC採択企業のVisual Bankが提供、【日本語話者・強弱つき感情ラベル・商用利用可の音声データ】でAI開発現場をご支援~

Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之、以下「Visual Bank」)は、傘下の株式会社アマナイメージズを通じて、あらゆる研究・商業AI開発に対応するAI学習用データソリューション『Qlean Dataset(キュリンデータセット)*』の提供を推進しています。
その中で、このたび『感情を込めた発話データセット』の提供を開始し、独自に構築したAI開発用データのラインナップ『データレシピ*』の拡充を進めています。
*データレシピ:https://qleandataset.visual-bank.co.jp/lineup
*Qlean Dataset詳細はこちら:https://qleandataset.visual-bank.co.jp/
『Qlean Dateset(キュリンデータセット)』のデータレシピについて
『データレシピ』は、『Qlean Dataset』における商用利用可能なオリジナルデータラインナップです。
用途や精度・納期に応じて、すぐに使えるデータ素材を柔軟に組み合わせられる構成が特長です。
一部アノテーション済み/未付与のデータや、個別要件に応じた構成変更・拡張にも対応可能です。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社とのパートナーシップ、国内外のネットワーク、新規収録などを通じて、ラインナップの拡充を進めています。
これにより、AI開発現場でのデータ収集・整備にかかる負荷を大幅に軽減し、開発のスピードアップに貢献します。




今回提供を開始する「感情を込めた発話データセット」の概要
-
含まれるデータ:10代から50代の日本人の男女100名による日本語の発話データ
感情分析の先行研究に基づく9種類の感情を収録
-
人物属性:日本人 男女100人(10代〜50代)
-
感情:普通、落ち着き、喜び、悲しみ、怒り、恐れ、嫌悪、驚き、焦り
-
セリフ:「ラジオからこんなニュースが流れてきた」
「テーブルに携帯電話が置かれている」 -
強弱:2種類(通常、強い)
-
ファイル数:6,800
-
データ形式:wav

「感情を込めた発話データセット」のユースケースイメージ
-
コールセンターにおける感情検知
顧客の怒りや焦りなどの感情をリアルタイムで検知し、応対品質の改善やエスカレーション判断にご活用いただけます。 -
対話型ロボット・家庭用AIアシスタント
話し手の感情を正しく捉え、返答のトーンや表現を調整することで、自然な音声対話を実現できます。 -
メンタルヘルス支援ツール
発話から落ち着きや焦りなどの情動変化を検知し、ストレス兆候のモニタリングや予兆検知にご活用いただけます。 -
音声合成AI・キャラクターボイス生成
感情バリエーションを含むセリフ音声により、キャラクターの個性を表現する音声生成モデルの学習にご活用いただけます。 -
感情分類AIの学習用教師データ
9感情×2強度の分類済み音声データを活用し、感情分類モデルの構築および精度向上にお役立ていただけます。 -
マルチモーダルAI開発
音声・セリフ・人物属性を組み合わせ、Vtuberやアバターなどの感情推定を行うマルチモーダルAIの開発にご利用いただけます。
-
教育・e-Learningコンテンツの生成
感情を伴う発話データを用いることで、非言語表現の教育や語学学習教材の構築にご活用いただけます。 -
モデル評価・ベンチマーク用途
感情ラベル付き音声を使い、感情分類AIの精度評価やABテストなどの検証にお使いいただけます。 -
映像・ナレーションに含まれる感情の分析
CMや動画コンテンツのナレーションに含まれる感情トーンを可視化し、「視聴者がどこで安心・驚き・不快を感じたか」といった反応を数値で捉えることができます。
UX改善やブランドメッセージの伝わり方の検証にご活用いただけます。
『Qlean Dataset』の提供するデータセットの特徴
-
研究開発、商用利用に完全対応
Qlean Datasetの提供するデータセットは、データ取得およびAI開発への利用に関する同意書を「すべての被写体」から取得しており、各国のプライバシーポリシー等にも対応しているため安心して研究・商用利用いただくことが可能です。 -
「データレシピ」からデータセットを提供するため、スピーディーかつROIを最大化
データレシピというQlean Dataset独自の提供形態を取ることにより、初期投資を抑えたデータ調達を行っていただくことが可能です。
-
「データレシピ」のプリセットにないデータセットは、個別要件に従った作成・構築も可能
独自性の高いデータについても『Qlean Dataset』のケイパビリティを活用し、独自要件のデータセットをご提供可能です。Qlean Dataset お問い合わせフォーム:https://qleandataset.visual-bank.co.jp/contact
Qlean Dataset サービスサイトURL: https://qleandataset.visual-bank.co.jp/
Qlean Dataset アカデミア支援プログラム
Visual BankはAI学習用データソリューション『Qlean Dataset』において、アカデミア支援の一環として、データセットの無償提供プログラムを開始しました。
対象は、大学・研究機関・非営利の技術開発チームなどで、画像/音声/動画/テキストなど、全80種類以上・50万点超のデータを提供いたします。
研究現場での「高品質かつ権利クリアな学習データが手に入らない」課題に対し、Qlean Datasetは、GENIAC採択企業としてその解決を支援します。
詳細はこちら:https://qleandataset.visual-bank.co.jp/academia

Visual Bank株式会社
AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。
代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL: https://amanaimages.com/about/
Qlean Dataset Releases Japanese Emotional Speech Dataset for AI Development
Empowering AI Development with Rights-Cleared, Emotion-Labeled Japanese Speech Data — 9 Emotion Categories for Voice AI, Emotion Recognition, and Multimodal Research

Tokyo, Japan — Visual Bank Inc. (CEO: Saneayuki Nagai, Headquarters: Minato-ku, Tokyo) announces the launch of the “Emotionally Expressive Speech Dataset” through its subsidiary Amana Images Inc., as part of its AI training data solution “Qlean Dataset” — designed to support both research and commercial AI development.
This new dataset expands Qlean Dataset’s proprietary data lineup known as “AI Data Recipe.”
→ Learn more about Data Recipes: https://qleandataset.visual-bank.co.jp/en/lineup
About Qlean Dataset and “AI Data Recipe”
AI Data Recipes are Qlean Dataset’s original, commercially usable data collections.
They are designed to be modular and flexible, allowing users to easily combine ready-to-use data materials depending on project requirements such as precision, use case, and delivery time.
Some datasets are pre-annotated or partially annotated, and can be customized or extended to meet individual project needs.
Qlean Dataset’s expansion is supported by partnerships with organizations such as Chiba Lotte Marines and Toyo Keizai Inc., as well as domestic and international networks and new recordings.
By streamlining the data collection and preparation process, Qlean Dataset significantly reduces the workload on AI development teams and accelerates development speed.
→ Learn more: https://qleandataset.visual-bank.co.jp/en/

Overview of the “Emotionally Expressive Speech Dataset”
-
Speakers: 100 native Japanese speakers (men and women, ages 10–50)
-
Emotions covered: 9 categories based on prior emotional analysis research
Neutral, Calm, Joy, Sadness, Anger, Fear, Disgust, Surprise, Impatience
-
Utterance examples:“I just heard this news on the radio.”“There’s a mobile phone on the table.”
-
Intensity levels: Two types (Normal / Strong)
-
File count: 6,800
-
Format: WAV
-
Sample: https://qleandataset.visual-bank.co.jp/en/lineup/ds-001
Use Case Examples
-
Emotion Detection in Call Centers
Detect emotions such as anger or frustration in real time to improve response quality and escalation decisions.
-
Conversational Robots and AI Assistants
Enable more natural speech interaction by adjusting tone and expressions based on the speaker’s emotions. -
Mental Health Support Tools
Detect emotional changes like calmness or anxiety in speech for stress monitoring and early warning systems. -
Speech Synthesis & Character Voice Generation
Use emotion-labeled speech data to train models that generate expressive character voices. -
Training Data for Emotion Classification AI
Leverage the labeled dataset (9 emotions × 2 intensities) to train and improve emotion classification models. -
Multimodal AI Development
Combine speech, utterances, and speaker attributes to develop emotion recognition systems for avatars and VTubers. -
Education and e-Learning Content
Utilize expressive speech data to teach non-verbal communication or language learning with emotional nuance. -
Model Evaluation and Benchmarking
Evaluate emotion classification models and conduct A/B testing with labeled speech data. -
Emotion Analysis in Media and Narration
Analyze emotional tone in narrations for commercials or videos to quantify viewer reactions (comfort, surprise, discomfort), supporting UX improvement and brand communication testing.
Features of Qlean Dataset’s Offerings
-
Ready for Both Research and Commercial Use
All data is collected with explicit consent from every participant and complies with international privacy standards, ensuring safe use for academic and commercial projects. -
Rapid, ROI-Optimized Delivery via “Data Recipes”
The Data Recipe model allows cost-effective, flexible data acquisition with reduced initial investment. -
Custom Dataset Development Available
Qlean Dataset can create bespoke datasets based on unique requirements, leveraging its full data production capabilities.Contact form: https://qleandataset.visual-bank.co.jp/en/contact
Service site: https://qleandataset.visual-bank.co.jp/en/lineup
About Visual Bank Inc.
Visual Bank Inc. is a next-generation data infrastructure startup dedicated to “unleashing the potential of all data.”
The company accelerates AI development across industries by providing solutions such as:
“THE PEN” — an AI-powered tool supporting manga creators, and
“Qlean Dataset” — a professional AI training data service provided through its wholly owned subsidiary Amana Images Inc.
Visual Bank is also a participant in Japan’s national R&D initiative GENIAC, advancing efforts toward real-world AI implementation.
Representative Director & CEO: Saneyuki Nagai
Headquarters: 6F-7F, C-Cube Minami Aoyama Building,7-1-7 Minami Aoyama, Minato-ku, Tokyo, 107-0062, Japan
Corporate URL: Visual Bank: https://visual-bank.co.jp/en/
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像
