C

Cosyvoice 300M SFT

FunAudioLLMによって開発
CosyVoiceはテキスト読み上げ(TTS)モデルで、複数の言語とスタイルの音声合成をサポートしています。
ダウンロード数 1,768
リリース時間 : 7/18/2024

モデル概要

CosyVoiceは先進的なテキスト読み上げモデルで、ゼロショット学習、クロスランゲージ変換、命令制御の音声合成をサポートしています。

モデル特徴

多言語サポート
中国語、英語、日本語、広東語、韓国語など複数言語の音声合成をサポートします。
ゼロショット学習
特定の話者のトレーニングデータがなくても、その音声スタイルを模倣できます。
クロスランゲージ変換
ある言語の音声スタイルを別の言語のテキストに適用できます。
命令制御
特別なタグを使用して音声の感情表現やスタイルを制御できます。

モデル能力

テキスト読み上げ
音声スタイル変換
多言語合成
感情音声合成

使用事例

音声アシスタント
インテリジェントカスタマーサービス
カスタマーサービスシステムに自然で流暢な音声出力を提供します。
ユーザー体験を向上させ、人手によるカスタマーサービスの負担を軽減
コンテンツ制作
オーディオブック制作
テキストコンテンツをさまざまなスタイルの音声に迅速に変換します。
コンテンツ生産効率を向上させ、制作コストを削減
教育
言語学習
標準的な発音の多言語音声サンプルを提供します。
学習者が正しい発音を習得するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase