国内生成AI開発プロジェクト「GENIAC」の第2期に採択&最先端の日本語音声生成モデルのプレイグランド、「Kotoba SpeechGen」β版をリリース
最先端の日本語音声生成モデルのプレイグラウンド「Kotoba SpeechGen」のβ版を10月28日に公開いたしました。
当プレイグラウンドの主な特徴は、以下の3点です。
Preset Voiceを活用し、従来の日本語TTSを超える流暢で自然な音声生成が可能です。
自分の声や音声ファイルをアップロードして利用できるボイスクローニング機能を新たに追加しました。
リアルタイム性を順次向上させ、順次、英語や東南アジアの言語などの多言語対応も予定しています。
プレイグラウンドの商用利用はできませんが、商用利用可能なAPIも順次公開予定です。プレイグラウンドへのアクセスはウェイトリスト順となります。
ウェイトリストへの登録はこちらから ( リンク:https://www.kotoba.tech/waitlist ) お願い致します。
なお、当社は、経済産業省および国立研究開発法人新エネルギー・産業技術総合開発機構(以下「NEDO」)が推進する国内生成 AI 開発プロジェクト(以下「GENIAC」)の第2期に採択されています。今年2月に発表された第1.5期に続き、2度目の採択となります。
日本とアジアの音声生成AIの基盤を築くため、大規模な計算資源を駆使して技術開発に邁進します。
第2期 採択結果はこちら:https://www.nedo.go.jp/news/press/AA5_101790.html
プレスリリース:https://prtimes.jp/main/html/rd/p/000000001.000151406.html