C

Cosyvoice 300M SFT

Developed by FunAudioLLM
CosyVoiceはテキスト読み上げ(TTS)モデルで、複数の言語とスタイルの音声合成をサポートしています。
Downloads 1,768
Release Time : 7/18/2024

Model Overview

CosyVoiceは先進的なテキスト読み上げモデルで、ゼロショット学習、クロスランゲージ変換、命令制御の音声合成をサポートしています。

Model Features

多言語サポート
中国語、英語、日本語、広東語、韓国語など複数言語の音声合成をサポートします。
ゼロショット学習
特定の話者のトレーニングデータがなくても、その音声スタイルを模倣できます。
クロスランゲージ変換
ある言語の音声スタイルを別の言語のテキストに適用できます。
命令制御
特別なタグを使用して音声の感情表現やスタイルを制御できます。

Model Capabilities

テキスト読み上げ
音声スタイル変換
多言語合成
感情音声合成

Use Cases

音声アシスタント
インテリジェントカスタマーサービス
カスタマーサービスシステムに自然で流暢な音声出力を提供します。
ユーザー体験を向上させ、人手によるカスタマーサービスの負担を軽減
コンテンツ制作
オーディオブック制作
テキストコンテンツをさまざまなスタイルの音声に迅速に変換します。
コンテンツ生産効率を向上させ、制作コストを削減
教育
言語学習
標準的な発音の多言語音声サンプルを提供します。
学習者が正しい発音を習得するのを支援
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase