TOPPANクロレ、高品質で迅速なオーディオブック制作を実現する日本語長文AI音声制作システムを開発
書籍や教材など幅広い用途に対応できるAI音声生成システムでオーディオブック受託制作事業を開始
TOPPANホールディングスのグループ会社であるTOPPANクロレ株式会社(本社:東京都北区、代表取締役社長:岡沢 宏和、以下 TOPPANクロレ)は、日本語長文AI音声制作システム(以下、本システム)を開発しました。
本システムは、オーディオブックなどのAI音声制作において、独自のデータ整形技術でAIの精度を向上させ、さらに日本語に適した間合いやアクセントを踏まえた読上げ内容をテキスト上で可視化し音声内容を調整できるシステムです。AI音声生成サービスと連携し、高品質で迅速な日本語長文のAI音声を制作することが可能となります。従来、書籍などの日本語長文のAI音声制作では、文章の区切りによる意味やニュアンスの違いという日本語独自の特徴により、微調整のための人手作業・ノウハウが必要とされ、多大な負荷がかかっていました。TOPPANクロレが培ってきた書籍制作などにおける日本語長文テキスト整形技術や、日本語の読上げエラー傾向などを体系化した膨大な特徴データにより、日本語長文に特化したAI音声制作を実現します。
TOPPANクロレは、本システムの活用により、出版社や新聞社などのコンテンツホルダーが発行する書籍や教材をはじめとして、幅広い用途における高品質で効率的なオーディオブック受託制作事業を開始します。
なお、本システムと連携するAI音声生成には、LINEヤフー株式会社のリアリティある肉声感、高度の言語分析などに対応が可能な音声合成編集ツール「Achoris Editor(読み:アコリスエディター)」を採用しています。

■ 開発の背景
近年のデジタル化に伴い書籍の売上が減少するなか、本を朗読するオーディオブック市場は、スマートフォンやワイヤレスイヤホンなどの普及により2024年に260億円規模に達する(※1)と予測される拡大市場となっています。また、2019年の読者バリアフリー法(※2)成立により、図書館にもオーディオブックの設備対応が進み、今後ますますニーズの高まりが期待されています。しかし、人による朗読を使用するオーディオブックの制作方法はコストが高く、供給が十分に追いついていないのが現状です。また、より簡易的な制作方法としてオーディオブック市場でもAI音声生成ソリューションの利用が進んでいますが、日本語長文は独自の特長が多くあり、生成エラーが膨大なことに加え、6~10時間を超える(※3)オーディオブックの品質チェックを人の耳で行わなくてはならないため、工数がかかることが課題となっていました。
TOPPANクロレは、2022年に業界の先駆けとしてAI音声を活用したオーディオブック事業を開始しました。自社オーディオブックストアの開設(※4)、コンテンツの制作など高品質で効率的なAI音声制作の研究に取り組む中で、日本語長文テキスト整形技術や日本語の読上げエラー傾向などを体系化した膨大な特徴データなどのノウハウを蓄積してきました。
これらの技術や知見を活かし、この度、TOPPANクロレは、AI音声生成における課題に対して、日本語長文に特化した音声合成制作システムを開発しました。本システムにより、日本語特有の読上げにおける微調整などを容易に行うことができ、従来の音声AI制作では膨大な制作時間を要していたオーディオブックなどの長文日本語コンテンツの高品質かつ迅速な制作を可能にします。
■ 日本語長文AI音声制作システムの特長
・オーディオブックなどの量産に対応したシステムを開発
本サービスでは、文章の区切りごとの余白やアクセント制御などを誰でも理解できるように分かりやすく可視化し、テキストデータ上でそれらの調整が可能です。日本語長文のAI音声制作では、文章の区切りによる意味やニュアンスの違いなどの修正必要箇所が多数あり、これらの微調整のための人手作業・ノウハウなどの負荷を削減することが可能です。本サービスの活用により従来のAI音声制作より工数を削減することができるため、オーディオブックの量産を可能とします。

・AIの精度向上のための独自のデータ整形技術を開発
本サービスでは、TOPPANクロレが書籍制作などで培った日本語長文テキスト整形技術を活かし、日本語AI音声がその特有の複雑さから判別できない部分を事前に整形することで、精度向上に寄与します。また、文章間における「間合い」を内容に応じて自動挿入することで、箇条書きなど通常のAI音声生成では音にした際に意味が伝わりづらい内容も、自然で聞き取りやすい音声の生成を実現します。
・TOPPANクロレとLINEヤフーのシステム連携で、日本語長文音声制作のシステム化を実現
TOPPANクロレの「AI音声可視化システム」とLINEヤフーが提供する音声合成編集ツール「Achoris Editor」を連携することで、日本語長文のAI音声制作における自動生成から微調整までをシステム上で一貫して対応することが可能です。本連携によりこれまで制作工数やコストが課題となり、オーディオブック制作が難しかった日本語長文の「約款」「マニュアル」「教材」など様々な分野での活用が可能です。
■今後の目標
TOPPANクロレは、日本語長文音声制作システムを活用し、2026年度までにまずは出版社や新聞社などのコンテンツホルダー、自治体を含む図書館などの運営事業者から2万件のオーディオブック制作受託を目指します。
今後は、本システムをSaaS型サービスとしての販売も検討し、多くの企業が手軽に高品質な音声コンテンツを制作・配信できる環境の構築を推進し、オーディオブック市場の拡大に貢献していきます。TOPPANクロレは、様々なコンテンツホルダーのオーディオブック制作に伴走し、日本語ならではの文章の響き、表現の美しさを大切にしたAI音声生成により、新たな読書体験の実現を支援します。
※1株式会社日本能率協会総合研究所(2020年)オーディオブック市場規模・予測
※2読書バリアフリー法
障害の有無に関わらず、すべての人が読書による文字・活字文化の恩恵を受けられるようにするための法律。さまざまな障害のある方が、利用しやすい形式で本の内容にアクセスできるようにすることを目指しています。
参照:文部科学省HP https://www.mext.go.jp/a_menu/ikusei/gakusyushien/mext_01304.html
※3 AI音声オーディオブック事業「ビジガク」(2024年5月でサービス終了)で取り扱ったオーディオブックの時間より算出
※4 2024年5月でサービスを終了しています。
* 本ニュースリリースに記載された商品・サービス名は各社の商標または登録商標です。
* 本ニュースリリースに記載された内容は発表日現在のものです。その後予告なしに変更されることがあります。
以 上
すべての画像