AI音声合成/音声認識を1つのSDKで実現 SLFramework(仮)評価版提供開始のお知らせ
高品質AI音声合成エンジンAITalk®を開発・提供する株式会社エーアイ(本社:東京都文京区、代表取締役社長:廣飯 伸一、証券コード:4388、以下:エーアイ)は、かねてより企画・開発を行っていたAI音声合成・音声認識を一体化したSDK「組み込み型音声対話フレームワーク SLFramework(仮)(以下:SLFramework)」の評価版提供を開始することをお知らせします。
また、併せて評価版の試用を希望されるユーザーを広く募集してまいります。
組み込み型音声対話フレームワーク SLFrameworkについて
SLFrameworkは、アプリケーションやサービスに対して音声での入出力を可能にする組み込み型SDKです。ユーザーの発話内容を認識してテキスト化する音声認識エンジンと、ユーザーへの応答テキストを読み上げる音声合成エンジンを1つのSDKとしてご提供します。
音声合成と音声認識の両方の技術を保有している強みを生かし、ユーザー単語辞書の共通化など、利便性の高いフレームワークとなっています。
2025年1月からいよいよ評価版の提供を開始します。
SLFrameworkを組み込んで使用する際のイメージ
SLFrameworkの特長
SLFrameworkは音声合成と音声認識を一体化したSDKであり、簡易に音声対話における入出力を実現できることが特長です。
組み込みしやすくユーザーにとって操作性の高い製品となっております。
-
共通ユーザー単語辞書…音声合成と音声認識でユーザー単語辞書を共有するため、1つの操作で音声合成と音声認識の両方に対応した単語を登録することができます。共通ユーザー単語辞書では、音声合成の際のアクセントを調整することも可能です。
-
ローカル型SDK…外部へアクセスしないので、よりセキュアな環境でご利用頂けます。音声認識モデル作成ツールにより、独自の言い回しや専門用語を含め、ご利用の用途に特化した音声認識モデルとしてカスタマイズすることが可能です。
-
省リソース…使用するメモリはRAM:400MB、ROM:210MBと小さくRaspberry Pi4でも十分に動作します。OSはWindows/Linuxに対応しています。
想定利用シーン
-
対話アプリ/ロボット/作業指示システム/券売機/ピッキングソリューション/コールセンター 等
デモ動画のご紹介
-
ユーザー辞書登録が音声認識/音声合成それぞれで反映されている様子を紹介します
今後の予定
SLFrameworkの製品版は2025年中のリリースを目指しています。
今回の評価版提供を通してユーザーからのフィードバックを収集し、製品としての最適化を進めていく予定です。
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像