fish-speech-1.4オープンソースのテキスト読み上げモデル - 70万時間のデータを基に多言語発音を実現

ホーム

Fish Speech 1.4

audoによって開発

70万時間の多言語音声データでトレーニングされた最先端のテキスト読み上げ(TTS)モデル

音声合成複数言語対応#70万時間のトレーニング #8言語対応 #商用レベルのTTS

ダウンロード数 24

リリース時間 : 9/12/2024

モデル概要

魚語音声V1.4は多言語テキスト読み上げモデルで、中国語、英語を含む8言語に対応し、音声合成や音声インタラクションシーンに適しています。

モデル特徴

多言語対応

中国語、英語などの主要言語を含む8言語のテキスト読み上げに対応

大規模トレーニングデータ

70万時間の多言語音声データでトレーニングされ、そのうち中国語と英語は各30万時間

オープンソース利用可能

ソースコードはBSD-3-Clauseライセンスで公開されており、研究開発に便利

モデル能力

テキスト読み上げ

多言語音声合成

音声インタラクションサポート

使用事例

音声インタラクション

スマート音声アシスタント

スマートデバイスに自然で滑らかな音声出力を提供

ユーザー体験の向上

コンテンツ制作

オーディオブック生成

テキストコンテンツを自動的に音声に変換

多言語オーディオコンテンツの効率的な生成

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Fish Speech 1.4

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Fish Speech V1.4

🚀 クイックスタート

📚 ドキュメント

引用

📄 ライセンス