鱼语语音V1.5 オープンソーステキスト読み上げモデル

ホーム

F15

cocktailpeanutによって開発

フィッシュスピーチ V1.5は、100万時間以上の多言語音声データでトレーニングされた最先端のテキスト読み上げ（TTS）モデルです。

音声合成複数言語対応#100万時間級のトレーニング #13言語対応 #学術レベルのTTS

ダウンロード数 5,162

リリース時間 : 12/4/2024

モデル概要

高度な多言語テキスト読み上げ合成システムで、13言語の音声合成をサポートしています。

モデル特徴

多言語サポート

主流のアジア言語とヨーロッパ言語を含む13言語のテキスト読み上げをサポート

大規模トレーニングデータ

100万時間以上の多言語音声データでトレーニング（英語と中国語は各30万時間以上）

学術研究サポート

正式に発表された学術論文でモデル技術をサポート

モデル能力

テキスト読み上げ

多言語音声合成

高品質音声出力

使用事例

コンテンツ制作

オーディオブック制作

テキストコンテンツを自然な音声に変換し、オーディオブック制作に利用

高品質な多言語音声出力

動画吹き替え

動画コンテンツに自動的に音声を生成

複数言語の吹き替えオプションをサポート

支援技術

視覚障害者支援

テキスト情報を音声出力に変換し、視覚障害者を支援

多言語サポートで利用範囲を拡大

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

F15

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Fish Speech V1.5

🚀 クイックスタート

サポート言語

📚 ドキュメント

引用

📄 ライセンス