国内生成AI開発プロジェクト「GENIAC」の第2期に採択されたコトバテクノロジーズ、最先端の日本語音声生成モデルのプレイグランド、「Kotoba SpeechGen」β版をリリース
GENIAC採択企業が切り拓く未来。革新的な「Kotoba SpeechGen」
株式会社Kotoba Technologies Japan(東京都千代田区、代表取締役:小島熙之、以下「コトバテクノロジーズ」)は、最先端の日本語音声生成モデルのプレイグラウンド「Kotoba SpeechGen」のβ版を10月28日に公開いたしました。
当プレイグラウンドの主な特徴は、以下の3点です。
-
Preset Voiceを活用し、従来の日本語TTSを超える流暢で自然な音声生成が可能です。
-
自分の声や音声ファイルをアップロードして利用できるボイスクローニング機能を新たに追加しました。
-
リアルタイム性を順次向上させ、順次、英語や東南アジアの言語などの多言語対応も予定しています。
プレイグラウンドの商用利用はできませんが、商用利用可能なAPIも順次公開予定です。プレイグラウンドへのアクセスはウェイトリスト順となります。ウェイトリストへの登録はこちらからお願い致します。
なお、当社は、経済産業省および国立研究開発法人新エネルギー・産業技術総合開発機構(以下「NEDO」)が推進する国内生成 AI 開発プロジェクト(以下「GENIAC」)の第2期に採択されています。今年2月に発表された第1.5期に続き、2度目の採択となります。日本とアジアの音声生成AIの基盤を築くため、大規模な計算資源を駆使して技術開発に邁進します。
第2期 採択結果はこちら:https://www.nedo.go.jp/news/press/AA5_101790.html
採択事業について
本事業では、音声基盤モデルの汎用性と代表的な音声アプリケーションを想定し、世界最大規模の高品質日本語音声データセット(40万時間)を生成・構築し、英語などの多言語音声データと組み合わせて、8B (80億) パラメータの音声基盤モデルを学習します。学習したモデルは、リアルタイム性・アプリケーションへの展開という面で、当社がGENAIC-1.5で構築したモデルの実績を大きく上回ることを目標とし、日本市場で使われるモデルとして性能・速度などの観点でベストオプションである水準まで持っていきます。音声商業アプリケーションのベータ版として市場に展開します。
GENIACについて
GENIAC(Generative AI Accelerator Challenge)は、国内の生成AIの開発力強化を目的とし、経済産業省およびNEDOが協力して実施する事業です。主に生成AIのコア技術である基盤モデルの開発に対する計算資源の提供や、データやAIの利活用に向けた実証調査の支援等を行っています。
URL:https://www.meti.go.jp/policy/mono_info_service/geniac/index.html
コトバテクノロジーズについて
米国のトップ学術機関において最先端のAIを研究していた2人が、スパコン富岳を活用した国産LLM開発の研究者とタッグを組み、共同創業しました。AIトップ会議に多数採択され、ベストペーパー賞などの実績を持つチームが一丸となり、研究開発を行っているのが当社の強みです。
「言葉」という漢字の起源は、紀貫之の詩の「人の心を種として、そこから生まれたものが言葉という葉」という文節に遡ると言われています。当社が開発する技術が種となり、社会に葉っぱのように広がっていてほしいと願い、Kotoba Technologies Japanと名づけました。日本を代表する生成AI企業を作り、みんながわっと驚く技術開発の中心でいることを目指しています。
コトバテクノロジーズでは、アプリケーションエンジニアや研究者を積極的に採用しています。ぜひ、採用ページをご参照ください。
会社概要
会社名:株式会社Kotoba Technologies Japan
所在地:東京都千代田区大手町1-6-1 大手町ビルヂング6階 Inspiared.Lab
代表者:代表取締役 小島熙之
設立:2023年7月
事業内容:音声基盤モデルの開発
URL: https://kotoba.tech
X: @kotoba_tech
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像
- 種類
- 商品サービス
- ビジネスカテゴリ
- システム・Webサイト・アプリ開発
- ダウンロード