K

Kotoba Speech V0.1

kotoba-techによって開発
Kotoba-Speech v0.1 は12億パラメータのTransformerベースの日本語音声生成モデルで、テキスト読み上げとワンショット音声クローニングをサポートしています。
ダウンロード数 23
リリース時間 : 3/14/2024

モデル概要

このモデルはエンドツーエンドのTransformerアーキテクチャ音声生成モデルで、日本語テキスト読み上げと音声クローニング機能に特化しています。

モデル特徴

流暢な日本語音声生成
日本語テキストを流暢に自然な音声に変換可能
ワンショット音声クローニング
音声プロンプトによる単一サンプルでの音声クローニング機能
大規模パラメータ
12億パラメータのTransformerアーキテクチャにより、高品質な音声生成を実現

モデル能力

日本語テキスト読み上げ
音声クローニング
音声合成

使用事例

音声インタラクション
音声アシスタント
日本語音声アシスタントに自然で流暢な音声出力を提供
ユーザー体験の自然さを向上
コンテンツ制作
オーディオブック生成
日本語テキストを自動的にオーディオブックに変換
高品質な音声コンテンツを効率的に生成
パーソナライズドサービス
個別音声クローニング
少数サンプルで特定人物の音声をクローニング
個別化された音声サービスを実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase