Qlean Dataset、「日本語・2話者・テクノロジーテーマトーク音声トランスクリプト」を提供開始

〜GENIAC採択企業のVisual Bank、テクノロジー領域の音声・テキストデータで音声対話AI・NLP研究を支援〜

Visual Bank株式会社

Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之、以下「Visual Bank」)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション『Qlean Dataset(キュリンデータセット)』において、『日本語・2話者・テクノロジーテーマトーク音声トランスクリプト』の提供を開始しました。

本データセットは、Qlean Datasetが展開する機械学習用データセットラインナップ『AIデータレシピ』の新たな1ラインナップとして拡充されたもので、テクノロジーやIT分野をテーマにした日本語の2話者対話音声と、その発話内容に対応したトランスクリプトで構成されています。対話内容には、生成AIを含む最新技術や関連ニュースへの言及に加え、日常的な工夫や活用事例など、複数の文脈を含む話題が含まれています。台本に依存しない自然な対話形式で、質問や説明、意見交換、比較、事例紹介などが実際の技術議論に近い流れで行われており、音声認識(ASR)、自然言語処理(NLP)、音声対話AIをはじめ、音声とテキストを横断的に扱うAIモデルの研究・開発用途に活用できます。

今回提供を開始する「日本語・2話者・テクノロジーテーマトーク音声トランスクリプト」のデータセット

データ種別

音声、テキスト

被写体属性

日本人、20代〜50代の男女

データ形式

音声データ:wav / mp3

テキストデータ:txt

収録時間

計約200時間(1音声約5分〜60分)

音声レート

44.1kHz

対象のシーン

・2者が技術・ITサービス・デジタル製品について語り合う、台本に依存しない自然な対話

・技術の背景や活用例について、質問と説明が交互に行われる会話構成

・比較・分析・事例紹介を含み、テクノロジー領域の幅広い話題を扱う対話シーン

サンプル詳細

https://qleandataset.visual-bank.co.jp/lineup/pn-025

「日本語・2話者・テクノロジーテーマトーク音声トランスクリプト」のユースケース

【研究用途】

  • 技術対話における発話役割・対話機能の分析

    生成AIやITニュースを題材とした2話者対話を用いて、質問、説明、補足、同意、反論といった発話役割の違いを分析する対話研究に利用できます。自然発話における話者間の役割分担や発話遷移の検証が可能です。

  • 専門トピックを含む音声認識モデルの評価

    生成AIやデジタル技術に関する用語や固有表現を含む対話音声とトランスクリプトを用いて、一般会話とは異なる条件下での音声認識精度や誤認識傾向の評価に活用できます。

  • 技術ニュース文脈における対話理解研究

    最新技術や関連ニュースに言及する会話を対象に、話題追跡、文脈理解、要点抽出などの自然言語処理モデルの検証データとして利用できます。

【産業用途(企業)】

  • 技術領域に特化した音声対話AIの学習

    生成AIやITサービスに関する説明・議論を含む対話データを用いて、技術文脈を理解する音声対話AIやチャットボットの応答理解・生成モデルの学習に利用できます。

  • 技術コンテンツの音声テキスト化・要約モデル開発

    比較や事例紹介を含む長尺の技術トーク音声とトランスクリプトを用いて、技術系ポッドキャストや解説コンテンツを想定した自動文字起こし、要約、ハイライト抽出モデルの開発に活用できます。

  • 技術サポート・社内ナレッジ向け音声処理モデルの検証

    ITツールの使い方や工夫といった実用的な話題を含む対話を用いて、社内向け技術サポートやナレッジ共有を想定した音声認識・対話理解モデルの検証に利用できます。

【その他実需要(教育・実践)】

  • 技術教育向け対話教材の研究利用

    専門的な技術テーマを平易な言葉で説明し合う対話を含むため、AI・IT分野の教育における対話型教材や説明支援モデルの検証用データとして活用できます。

『Qlean Dataset(キュリンデータセット)』について

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。

また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。

Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。

▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/

▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup

『Qlean Dataset』の提供するデータセット『AIデータレシピ』の特徴

  • すべての被写体から同意取得

  • 既存データは最短1日で納品可能

  • カスタム撮影・収録・収集による独自データ構築にも対応

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。

また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之

所在地:〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F

Visual Bank企業URL:https://visual-bank.co.jp/

アマナイメージズ企業URL:https://amanaimages.com/about/


【Translation】

Qlean Dataset Launches Japanese Two-Speaker Technology Dialogue Speech & Transcription Corpus

A Natural Conversational Dataset for ASR, Conversational AI, and NLP Research

Visual Bank Inc. (Minato-ku, Tokyo; CEO: Saneyuki Nagai; hereinafter “Visual Bank”) has launched a new dataset titled “Japanese Two-Speaker Technology-Themed Speech Transcripts” as part of Qlean Dataset, its AI training data solution operated through its subsidiary, Amana Images Inc.

This dataset is a new addition to AI Data Recipe, Qlean Dataset’s machine learning dataset lineup. It consists of Japanese two-speaker conversational speech centered on technology and IT topics, along with corresponding speech transcripts.

The conversations cover multiple contextual layers, including references to recent technological developments such as generative AI, related industry news, and practical usage ideas from everyday perspectives. The dialogues are unscripted and progress naturally through questions, explanations, opinion exchanges, comparisons, and real-world examples, closely reflecting authentic technical discussions.

The dataset is suitable for research and development across AI models that handle both speech and text, including automatic speech recognition (ASR), natural language processing (NLP), and conversational speech AI systems.

Overview of the “Japanese Two-Speaker Technology-Themed Speech Transcripts”

Data Types

Audio, Text

Speaker Attributes

Japanese speakers, male and female, aged 20s to 50s

Data Formats

Audio: wav / mp3
Text: txt

Total Recording Duration

Approximately 200 hours in total (each recording ranges from approximately 5 to 60 minutes)

Sampling Rate

44.1 kHz

Covered Dialogue Scenes

・This dataset features two-speaker conversations focused on technology and IT topics.
・The dialogues are unscripted and naturally progress through questions, explanations, and discussion.
・They include comparisons and real-world examples across a wide range of technology themes.

Sample Details

https://qleandataset.visual-bank.co.jp/en/lineup/pn-025

Use Cases for the Japanese Two-Speaker Technology Dialogue Dataset

Research Applications

  • Understanding Speaker Roles in Technical Dialogue
    Two-speaker conversations on generative AI and IT topics support analysis of how questions, explanations, agreement, and disagreement unfold in natural technical discussions.

  • Evaluating ASR Performance on Technical Speech
    Dialogue speech and transcripts containing technical terms enable evaluation of ASR accuracy and error patterns beyond everyday conversation.

  • Dialogue Understanding in Technology News Contexts
    Conversations referencing recent technologies and news can be used to test topic tracking, contextual understanding, and key information extraction models.

Industrial Applications

  • Training Conversational AI for Technical Domains
    Dialogue data discussing generative AI and IT services can be used to train speech-based conversational AI and chatbots that require technical context understanding.

  • Speech-to-Text and Summarization for Technical Content
    Long-form technology conversations support the development of transcription, summarization, and highlight extraction models for technical audio content.

  • Validating Models for Technical Support and Knowledge Sharing
    Practical conversations about IT tools and workflows are suitable for evaluating speech recognition and dialogue understanding models for internal use.

Other Practical Applications

  • Dialogue-Based Learning and Education
    Clear, accessible explanations of technical topics make the dataset useful for developing dialogue-based learning and explanation support models in AI and IT education.


About Qlean Dataset

Qlean Dataset is a commercial-use-ready AI training data solution provided by Amana Images Inc., a subsidiary of Visual Bank Inc.
It supports a wide range of data types, including images, videos, audio, 3D assets, and text, enabling both research and commercial AI development in a legally safe environment.

Through collaborations with data partners such as Chiba Lotte Marines Co., Ltd. and Toyo Keizai Inc., Qlean Dataset continues to expand its specialized, industry-focused lineup known as the “AI Data Recipe.”

By reducing the operational burden of data collection and preparation, Qlean Dataset helps organizations establish AI development environments that are both legally compliant and risk-free.

▶ Qlean Dataset: https://qleandataset.visual-bank.co.jp/en
▶ AI Data Recipe: https://qleandataset.visual-bank.co.jp/en/lineup

Key Features of Qlean Dataset

  • Existing datasets deliverable within one business day

  • Custom data collection and recording services available

About Visual Bank Inc.

Visual Bank Inc. is a Tokyo-based startup building Next-Generation Data infrastructure to enhance AI development capabilities under the mission “Unlocking Data Accessibility.”
The company operates THE PEN, an AI-assisted creative tool for manga artists and the Qlean Dataset service.

Its subsidiaries include Amana Images Inc., one of Japan’s largest photostock providers; Qlean Dataset, which leads research and development in AI data; and THE PEN Inc., an AI-assisted creative tool for manga artists.

CEO: Saneyuki Nagai
Address: 6F, C-Cube Minami Aoyama Building, 7-1-7 Minami-Aoyama, Minato-ku, Tokyo
Corporate Site: https://visual-bank.co.jp/en
Amana Images: https://qleandataset.visual-bank.co.jp/en/company-overview

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


会社概要

Visual Bank株式会社

14フォロワー

RSS
URL
https://visual-bank.co.jp/
業種
情報通信
本社所在地
東京都港区南青山7-1-7 C-Cube南青山ビル6F
電話番号
0120-410-225
代表者名
永井 真之
上場
未上場
資本金
8億9848万円
設立
2022年04月