C

Cosyvoice2 0.5B

FunAudioLLMによって開発
CosyVoiceはテキスト読み上げ(TTS)モデルで、多言語対応と音声変換機能を備え、高品質な音声合成を提供します。
ダウンロード数 4,573
リリース時間 : 12/20/2024

モデル概要

CosyVoiceは先進的なテキスト読み上げモデルで、ゼロショット音声合成、クロスランゲージ音声合成、音声変換機能をサポートしています。テキスト入力から自然で流暢な音声を生成でき、複数の言語と音声スタイルに対応しています。

モデル特徴

多言語サポート
中国語、英語、日本語、広東語、韓国語など複数言語の音声合成に対応
ゼロショット音声合成
特定の話者データがなくても目標の音声スタイルを生成可能
クロスランゲージ音声合成
ある言語の音声サンプルを使って別の言語の音声を合成可能
音声変換
ソース音声を目標の音声スタイルに変換可能
ストリーミング推論
リアルタイムストリーミング音声生成をサポート、品質劣化なし

モデル能力

テキスト読み上げ
音声スタイル変換
多言語音声合成
ゼロショット音声合成
クロスランゲージ音声合成
ストリーミング音声生成

使用事例

音声アシスタント
多言語音声アシスタント
音声アシスタントに自然で流暢な多言語音声出力を提供
高品質な音声合成効果
オーディオコンテンツ制作
オーディオブック制作
テキストコンテンツを迅速に自然音声に変換
効率的なコンテンツ生産プロセス
ゲーム開発
ゲームキャラクター音声
ゲームキャラクターに多様な音声を生成
豊富なキャラクター音声表現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase