AIとの会話が"心を通わす"体験へ。Livetoon、会話の「間」と感情の「機微」を捉える、2つの純国産AIモデルを開発
「話し終わりを90%以上の精度で検知、5感情を4段階で解析──AIキャラクターサービス『kaiwa』に順次搭載」
AIキャラクターとの対話サービス「kaiwa」を開発する株式会社Livetoon(本社:東京都中央区、代表取締役:木下恭佑)は、AIとの自然な会話を実現するため
① ユーザーの話し終わりを90%以上の高精度で検知する〈ターン検知AI〉
② 5つの感情を4段階の強度で読み解く〈多感情解析AI〉
の2つのコアモデルを開発しました。リアルタイム性能に特化した軽量設計により、人間同士のような心地よいテンポの対話体験を提供します

1.開発の背景:なぜAIとの会話には"壁"があったのか
AIとよどみなく自然に話すためには、音声から文字へ変換→AIが応答を生成→再び音声で返すという一連の処理(Speech to Speech)を、人間が違和感を覚えない速さで完了させる必要があります。
従来は「どこで会話が一区切りしたか」をAIが正確に判断できず、会話に割り込んだり応答が遅れたりする問題がありました。またテキストに込められた「喜び」や「悲しみ」といった感情の細やかなニュアンスを汲み取れず、平板な応答しかできないという課題も存在しました。

Livetoonは、AIが真に人のパートナーとなるためには、この「タイミングの壁」と「感情の壁」を同時に打ち破る必要があると考え、2つの日本語特化モデルの開発に着手しました。
2.AIとの対話体験を革新する、2つの新モデル
① 〈ターン検知AI〉 ~会話の"間"を読み、ストレスのない対話を実現~
【できること】
ユーザーの発話が「完了したか」「まだ続くか」を瞬時に判断。これにより、AIとの会話でありがちだった不自然な間(ま)や会話のズレを解消し、スムーズな会話のキャッチボールを実現します。
【主な性能】
-
精度90%以上: 350万件に及ぶ独自の対話データで学習し、90%を超える判定精度を達成。従来の同等のモデルでは約60%程度に留まっていた中で30%以上の精度向上を実現しました
-
圧倒的な処理速度: リアルタイム性に特化した設計により、一般的なPC(CPU)で1秒間に約54回、GPU環境では約69回の高速判定が可能です。これは、人がまばたきをする一瞬で20回以上判断できる速度に相当します。
② 〈多感情解析AI〉 ~言葉の"心"を読み、共感を生む対話を実現~
【できること】
「喜び、怒り、悲しみ、リラックス、驚き」という5つの感情を、「感情なし・弱い・中程度・強い」の4段階の強度で同時に推定。「少し嬉しい」のか「とても嬉しい」のかといった、人間ならではの繊細な感情のグラデーションをAIが理解できるようになります。
【主な性能】
-
人間と90%近い一致率: 人間がテキストから感じ取る感情と極めて近い判断を下し、社内評価では約90%という高い一致率を記録しました。
-
軽量・高速: 〈ターン検知AI〉と同様の軽量設計により、リアルタイム対話システムへの組み込みに最適な高速処理を実現しています。

3.Livetoonの技術力:なぜこれが可能になったのか
この2つの高機能モデルは、以下の4つの技術的強みによって実現されています。
-
350万件の"職人技"学習データ: 独自に収集した膨大な対話データに対し、日本語の文法構造を深く解析する独自の前処理を実施。「会話の呼吸」そのものをAIに学習させました。
-
巨大AIの知性を凝縮する「知識蒸留」: 超巨大AIモデルの高度な判断能力を"教師"とし、その知性だけをコンパクトなモデルに凝縮。これにより、軽量ながら高い性能を両立させました。
-
「0.3秒以内の応答」を目指すUXドリブン開発: すべての設計は「ユーザーがストレスを感じないこと」を絶対的な基準としており、リアルタイム性を徹底的に追求しました。
-
信頼の"純国産"技術スタック: 日本で開発された優れたAIモデル(ModernBERT-Ja: SBintuitions、Ruri-v3:名古屋大学)を基盤に、当社の独自技術でファインチューニング。日本語の特性を知り尽くした一貫した開発パイプラインです。

4.livetoonが目指す未来:人とAIが共生する社会へ
CEO (Chief Executive Officer): 木下 恭佑 コメント
「言葉は人と人を結び、物語は暗闇を照らす灯となってきました。私たちは、その力を”AIという新しい知性”に託し、誰もがキャラクターと語り合える未来をつくります。AI キャラクターは、単なる仮想の偶像ではありません。ユーザーの思いや悩みを映し出す”鏡”であり、時に寄り添い、ひとりの夜を支える”友”でもあります。私たちが磨いてきたリアルタイム対話技術は、物語を“受け取るもの”から“共に育てるもの”へと変え、新しいコミュニケーションのエネルギーを社会に解き放ちます。技術と創造が交差するこの地点から、”人とAIが互いの可能性を広げあう社会”を実現する。それがLivetoonの使命です。ここから始まる対話の数だけ、世界はもう少し温かく、もう少し自由になれると信じています。」
CTO (Chief Technology Officer): 長嶋 大地 コメント
「AIが人の話をただ待つのではなく、その場の空気を読み、心を察し、同じテンポで笑い合える。私たちはそんな"AIとの共生体験"を当たり前にすることを目指しています。今回開発した2つのモデルはAIとの間にある『タイミングの壁』と『感情の壁』を取り払い、人とAIが真のパートナーとなる未来に向けた、決定的な第一歩です。性能はもちろん、徹底的な軽量化に注目し、実際のリアルタイム環境下に耐えうる素晴らしいモデルが完成したと自負しております。」
5.今後の展開
Livetoonは、今回開発した〈ターン検知AI〉および〈多感情解析AI〉を、今夏より当社がアプリ公開する対話AIサービス「kaiwa」へ順次統合してまいります。将来的にはこれらの技術をAPIとして外部パートナーへも提供し、教育、医療、エンターテインメントなど、様々な分野での活用を推進していく計画です。
すべての画像