fish - speech - 1.5オープンソーステキストトゥスピーチモデル - 超百万時間のデータに基づく多言語発声

ホーム

Fish Speech 1.5

jkeislingによって開発

100万時間以上の多言語音声データでトレーニングされた先進的なテキスト読み上げ(TTS)モデル

音声合成

Safetensors

複数言語対応#多言語TTS #100万時間以上のトレーニング #非商用利用

ダウンロード数 194

リリース時間 : 12/7/2024

モデル概要

Fish Speech V1.5は高性能な多言語テキスト読み上げモデルで、13言語をサポートし、特にRustエコシステムとの互換性を最適化しています。

モデル特徴

多言語サポート

中国語、英語、日本語などの主要言語を含む13言語をサポート

大規模トレーニング

100万時間以上の多言語音声データでトレーニング

Rustエコシステム互換

fish-speech.rsフレームワークとCandle.rsへの適合を特別に最適化

重みセキュリティフォーマット

.safetensors形式で重みを保存し、セキュリティを向上

モデル能力

高品質テキスト読み上げ

多言語音声合成

13言語変換サポート

使用事例

音声合成

多言語音声アシスタント

多言語アプリケーションに自然な音声出力を提供

高品質で自然な音声合成効果

オーディオブック生成

テキストを自動的に複数言語のオーディオブックに変換

複数言語と発音スタイルをサポート

🚀 フィッシュスピーチ V1.5

このモデルは、複数言語の100万時間以上の音声データで学習された、最先端のテキスト読み上げ（TTS）モデルです。

これは、fish-speech.rs で動作するように、公式のフィッシュスピーチ V1.5 の重みを再フォーマットしたものです。

Candle.rs と HuggingFace エコシステムとの互換性を向上させるために、以下の変更を行いました。

DualARトランスフォーマーの重みを .safetensors に変換し、安全性と読み込みの容易さを向上させました。
トークナイザーを Tiktoken 形式とカスタムラッパーから HuggingFace Tokenizers に移植し、下流での使用を容易にしました。
VQGAN は v1.4 から変更されていないため、前回の変換から重み正規化がマージされた safetensors と FireflyGAN の設定をコピーしました。

⚠️ 重要提示

元のライセンスを尊重し、このモデルを商用目的で使用しないでください。fish.audio の公式APIを使用することで、Fish Audio をサポートできます。

これらの重みは公式のFish Speech推論コードでは動作しません！

🚀 クイックスタート

このモデルは、複数言語の音声合成に使用できます。以下に、サポートされている言語とその学習時間を示します。

言語	学習時間
英語 (en)	>300k時間
中国語 (zh)	>300k時間
日本語 (ja)	>100k時間
ドイツ語 (de)	~20k時間
フランス語 (fr)	~20k時間
スペイン語 (es)	~20k時間
韓国語 (ko)	~20k時間
アラビア語 (ar)	~20k時間
ロシア語 (ru)	~20k時間
オランダ語 (nl)	<10k時間
イタリア語 (it)	<10k時間
ポーランド語 (pl)	<10k時間
ポルトガル語 (pt)	<10k時間

詳細については、Fish Speech Github を参照してください。
デモは Fish Audio で利用できます。

📚 ドキュメント

引用

このリポジトリが役に立った場合は、以下のように引用してください。

@misc{fish-speech-v1.4,
      title={Fish-Speech: Leveraging Large Language Models for Advanced Multilingual Text-to-Speech Synthesis}, 
      author={Shijia Liao and Yuxuan Wang and Tianyu Li and Yifan Cheng and Ruoyi Zhang and Rongzhi Zhou and Yijin Xing},
      year={2024},
      eprint={2411.01156},
      archivePrefix={arXiv},
      primaryClass={cs.SD},
      url={https://arxiv.org/abs/2411.01156}, 
}