Qlean Dataset、「日本語・2話者・教育テーマトーク音声コーパスとトランスクリプト」を提供開始

〜GENIAC採択企業のVisual Bank、教育精度・進路相談・学習環境を巡る対話音声データでASR/NLP/LLM開発を支援〜

Visual Bank株式会社

Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、ASR(自動音声認識)、NLP(自然言語処理)、LLMなどの音声・言語系AI開発に向けた「日本語・2話者・教育テーマトーク音声コーパスとトランスクリプト」の提供を開始しました。

本データセットは、教育制度や進路相談、学習環境と個人の意思決定が交差するテーマなどについて、2名の話者が対話形式で意見や考えを交わす日本語音声と、その発話内容を書き起こしたトランスクリプトを組み合わせたものです。

収録にあたっては台本に依存せず、質問と応答、具体的な体験の共有、考えの整理といったやり取りが自然な流れで進行する対話構造を前提としています。2話者による発話の切り替わりや相互参照を含む音声とテキストが対応付けられており、単発発話では捉えにくい文脈理解や対話構造を伴う検証に利用できる構成としています。

Qlean Datasetは、研究用途から商用開発までを見据え、権利処理や利用条件を整理した形でAI開発用データを提供しており、本データセットもその一環として、教育・進路・学習といった領域に関する日本語対話データを必要とする研究者・開発者の検証環境整備を目的に提供されます。

今回提供を開始する「日本語・2話者・教育テーマトーク音声コーパスとトランスクリプト」の概要

データ種別

音声、テキスト

被写体属性

20代〜50代の男女

データ形式

音声データ:wav /mp3
テキストデータ:txt

収録時間

計約900時間(1音声約5分〜60分)

音声レート

44.1kHz

対象のシーン

・教育や学習、進路に関するテーマについて、2名が対話する日本語音声

・教員免許取得、将来設計、受験、教育方針、SNSなどの話題を含む会話

サンプル詳細

https://qleandataset.visual-bank.co.jp/lineup/pn-016

「日本語・2話者・教育テーマトーク音声コーパスとトランスクリプト」のユースケースイメージ

 【研究用途】 

  • 対話音声を用いたASRモデルの評価・分析
    教育や進路に関する対話音声を用い、話者交替や相互応答を含む条件下での日本語音声認識精度や誤認識傾向の分析に利用できます。

  • 教育・進路テーマにおける対話理解研究
    進路選択や学習方針に関する対話トランスクリプトを用いて、話題遷移や意見形成の流れを対象とした対話理解・文脈解析手法の研究に利用できます。

 【産業用途】 

  • 教育・進路相談を想定した対話AIの検証
    進路や学習に関する相談シーンを想定し、対話型AIやチャットボットにおける意図理解や応答設計の検証用データとして利用できます。

  • LLMの日本語対話評価・事前検証
    教育や学習を巡る価値観・判断を含む対話テキストを用いて、LLMの日本語対話処理能力や文脈保持性能を評価する用途に利用できます。

 【その他実需要】 

  • 教育・学習相談サービスにおける対話品質検証
    進路選択や受験、子育て方針などの話題を含む対話音声を用い、教育・学習相談サービスにおける対話の自然さや応答の流れを検証するための参考データとして利用できます。

  • 教育関連サポート窓口における音声認識検証
    教育分野特有の語彙や話題を含む対話音声を用いて、問い合わせ対応や相談窓口を想定した音声認識・書き起こし精度の検証に利用できます。

『Qlean Dataset(キュリンデータセット)』について

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。

また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。

Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。

▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/

▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup

『Qlean Dataset』の提供するデータセット『AIデータレシピ』の特徴

  • すべての被写体から同意取得

  • 既存データは最短1日で納品可能

  • カスタム撮影・収録・収集による独自データ構築にも対応

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。

また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之

所在地:〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F

Visual Bank企業URL:https://visual-bank.co.jp/

アマナイメージズ企業URL:https://amanaimages.com/about/


【Translation】

Qlean Dataset Launches a Japanese Educational Dialogue Speech Corpus for AI Development

Supporting ASR, Conversational AI, and Dialogue Understanding in Education

Visual Bank Inc. (Minato-ku, Tokyo; CEO: Saneyuki Nagai), through its subsidiary Amana Images Inc., has begun offering a “Japanese Two-Speaker Education-Themed Dialogue Speech Corpus and Transcripts” via its AI training data solution, Qlean Dataset.
This dataset is designed to support the development of speech- and language-based AI technologies, including Automatic Speech Recognition (ASR), Natural Language Processing (NLP), LLMs.

 The dataset consists of Japanese dialogue audio in which two speakers discuss topics related to education, career guidance, learning environments, and personal decision-making. Each recording is provided with aligned transcripts reflecting the spoken content.

All conversations are unscripted and progress naturally through questions, responses, and the sharing of experiences. Speaker turn-taking and contextual references are preserved, making the dataset suitable for evaluating dialogue understanding and conversational structure.

Qlean Dataset provides rights-cleared data for both research and commercial AI development. This dataset is offered to support researchers and developers who require Japanese educational dialogue data for evaluation and validation purposes.

Overview of the Japanese Two-Speaker Education Dialogue Corpus

Data Type

Voice, text

Subject attributes

Men and women in their 20s to 50s

Data Format

Audio data: wav

Text data: txt

Recording Time

Total: Approximately 883 hours (approximately 5-60 minutes per audio segment)

Audio Rate

44.1kHz

Target Scenes

・Japanese audio recordings featuring dialogues between two speakers on topics related to education, learning, and career paths

・Conversations covering themes such as teacher certification, future planning, entrance examinations, educational policies, and the role of social media

sample

https://qleandataset.visual-bank.co.jp/en/lineup/pn-016

Use Case Examples for the Japanese Two-Speaker Education Dialogue Corpus 

[Research Applications] 

  • Evaluation and Analysis of ASR Models Using Dialogue Speech
    Dialogue audio related to education and career guidance can be used to analyze Japanese speech recognition accuracy and error patterns under conditions involving speaker alternation and interactive responses.

  • Dialogue Understanding Research in Education and Career Guidance Contexts
    Dialogue transcripts related to career choices and learning policies can be used to study dialogue understanding and contextual analysis methods, including topic transitions and opinion formation processes.

Industrial Applications 

  • Validation of Dialogue AI for Education and Career Counseling
    The dataset can be used as evaluation data for intent understanding and response design in conversational AI and chatbots designed for education and career consultation scenarios.

  • Preliminary Evaluation of Japanese Dialogue Processing in LLMs
    Dialogue text that includes values and decision-making related to education and learning can be used to evaluate Japanese dialogue handling capabilities and contextual retention performance of LLMs.

Additional Practical Use Cases 

  • Dialogue Quality Evaluation for Education and Learning Support Services
    Dialogue audio covering topics such as career selection, entrance examinations, and parenting policies can serve as reference data for evaluating the naturalness and flow of conversations in education-related consultation services.

  • Speech Recognition Evaluation for Education Support Contact Centers
    Dialogue audio containing education-specific vocabulary and topics can be used to assess speech recognition and transcription accuracy for inquiry handling and consultation desk scenarios.

About Qlean Dataset

Qlean Dataset is a commercial-use-ready AI training data solution provided by Amana Images Inc., a subsidiary of Visual Bank Inc.
It supports a wide range of data types, including images, videos, audio, 3D assets, and text, enabling both research and commercial AI development in a legally safe environment.

Through collaborations with data partners such as Chiba Lotte Marines Co., Ltd. and Toyo Keizai Inc., Qlean Dataset continues to expand its specialized, industry-focused lineup known as the “AI Data Recipe.”

By reducing the operational burden of data collection and preparation, Qlean Dataset helps organizations establish AI development environments that are both legally compliant and risk-free.

▶ Qlean Dataset: https://qleandataset.visual-bank.co.jp/en
▶ AI Data Recipe: https://qleandataset.visual-bank.co.jp/en/lineup

Key Features of Qlean Dataset

  • Existing datasets deliverable within one business day

  • Custom data collection and recording services available

About Visual Bank Inc.

Visual Bank Inc. is a Tokyo-based startup building Next-Generation Data infrastructure to enhance AI development capabilities under the mission “Unlocking Data Accessibility.”
The company operates THE PEN, an AI-assisted creative tool for manga artists and the Qlean Dataset service.

Its subsidiaries include Amana Images Inc., one of Japan’s largest photostock providers; Qlean Dataset, which leads research and development in AI data; and THE PEN Inc., an AI-assisted creative tool for manga artists.

CEO: Saneyuki Nagai
Address: 6F, C-Cube Minami Aoyama Building, 7-1-7 Minami-Aoyama, Minato-ku, Tokyo
Corporate Site: https://visual-bank.co.jp/en
Amana Images: https://qleandataset.visual-bank.co.jp/en/company-overview

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


会社概要

Visual Bank株式会社

14フォロワー

RSS
URL
https://visual-bank.co.jp/
業種
情報通信
本社所在地
東京都港区南青山7-1-7 C-Cube南青山ビル6F
電話番号
0120-410-225
代表者名
永井 真之
上場
未上場
資本金
8億9848万円
設立
2022年04月