SpiralAI、自然言語処理分野のトップカンファレンス「ACL 2026」の本会議にて論文採択
〜 人のように話し、日本語の文脈に応じて発音する音声AIの新手法を提案 〜
大規模言語モデルなどのAI技術を用いたサービスを開発するSpiralAI株式会社(本社:東京都千代田区、代表取締役:佐々木雄一、以下「SpiralAI」)は、リサーチャーの小峠陸登および代表の佐々木雄一による論文が自然言語処理分野の国際会議「ACL 2026(The 64th Annual Meeting of the Association for Computational Linguistics、以下「ACL」)」の本会議に採択されたことをお知らせいたします。

このたび採択された論文は、2026年7月2日から7月7日にかけてアメリカのサンディエゴでの発表を予定しています。
▼採択された論文はこちら
https://arxiv.org/pdf/2510.05799
■「ACL」とは
LLMの急速な進歩により、自然言語処理分野(NLP)はAIの中でも特に世界的な注目を集めており、「ACL」は、自然言語処理分野において最も権威ある国際会議の一つです。
2026年の論文投稿数は12,148件、採択率19%と年々投稿数は増加しており、大手テック企業や世界中の研究機関が技術開発に注力し、競争は激化しています。
このたび採択された論文は、査読において採択論文のTop 50%との高い評価を受けました。
▼「ACL 2026」公式サイト
◾️採択された論文の概要
「ACL 2026」Main Conference Short Paper
著者:小峠陸登 (SpiralAI/大阪大学)・佐々木雄一 (SpiralAI/静岡大学)
「Data-efficient Targeted Token-level Preference Optimization for LLM-based Text-to-Speech」
近年、音声合成技術は急速に進展していますが、日本語においては「辛い(からい/つらい)」のように文脈に依存して発音が変化するケースが多く、従来の手法では十分な精度が得られない課題がありました。
本研究では、LLMベース音声合成(TTS)の性能を向上させる新手法「TKTO(Token-level Kahneman-Tversky Optimization)」を提案しました。
本手法は、従来の発話単位ではなくトークン単位での選好最適化を行うことで、日本語のような文脈依存の発音問題に対して高精度な音声生成を実現します。さらに従来手法では必要だった良否ペアデータを不要とし、最大6倍のデータ活用を可能にすることで、効率的な学習を実現しました。
実験では、「辛い」の発音精度を39%向上、文字誤り率(CER)を54%削減するなど、大幅な性能改善を確認しています。
◾️今後について
これらの研究の成果は「辛い」を含む様々な日本語の読み方、アクセント、イントネーションの改善のため、15万回以上のアノテーションおよび学習を実施し、音声合成プラットフォーム「Kotodama(コトダマ)」や会話型AIアプリ「梵そよぎAI - 0rigin -」を含むプロダクトで活用しています。
今後もSpiralAIでは、高精度な音声合成や音声対話に向けて、最先端の研究開発を進めてまいります。
<活用プロダクト>


・音声合成プラットフォーム「Kotodama(コトダマ)」の詳細はこちら
https://lp.kotodama.go-spiral.ai/
・会話型AIアプリ「梵そよぎAI - 0rigin -」の詳細はこちら
https://prtimes.jp/main/html/rd/p/000000076.000120221.html
■ 会社概要
社名 SpiralAI株式会社 / SpiralAI Inc.
事業内容 大規模言語モデルなどのAI技術を用いたサービスの開発
役員 代表取締役 CEO 佐々木雄一
所在地 〒101-0031東京都千代田区東神田2-2-5 PMO秋葉原Ⅲ5階
設立 2023年3月1日
会社URL https://go-spiral.ai/
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像
