# 即時語音生成

Qwen2.5 Omni 7B AWQ
其他
Qwen2.5-Omni是一款端到端多模態模型,能夠感知包括文本、圖像、音頻和視頻在內的多種模態,同時以流式方式生成文本和自然語音響應。
多模態融合 Transformers 英語
Q
Qwen
77
8
Spark TTS 0.5B 8bit
這是一個基於MLX格式的文本轉語音模型,支持英文和中文,由prince-canuma/Spark-TTS-0.5B轉換而來。
語音合成 支持多種語言
S
mlx-community
56
1
Spark TTS 0.5B 4 6bit
Spark-TTS-0.5B-4-6bit 是一個基於 MLX 格式的文本轉語音模型,支持英文和中文。
語音合成 支持多種語言
S
mlx-community
59
0
Muyan TTS SFT Q8 0 GGUF
該模型是基於MYZY-AI/Muyan-TTS-SFT轉換的GGUF格式文本轉語音模型,支持中文語音合成。
語音合成
M
NikolayKozloff
20
1
Kokorotts
Apache-2.0
Kokoro是一款擁有8200萬參數的開源文本轉語音模型,以輕量架構提供媲美大型模型的音質,同時顯著提升速度和成本效益。
語音合成 英語
K
Daemontatox
78
0
Kokoro 82M V1.1 Zh
Apache-2.0
Kokoro 是一個開放權重的小型但功能強大的文本轉語音(TTS)模型系列,新增了來自專業數據集的100名中文說話人數據。
語音合成
K
hexgrad
51.56k
112
Kokoro 82M Light
Apache-2.0
基於StyleTTS2-LJSpeech的克隆版本,針對英語文本轉語音任務進行了優化,移除了部分依賴項以簡化部署。
語音合成 英語
K
ctranslate2-4you
21
8
Llasa 1B Q8 0 GGUF
該模型是從HKUST-Audio/Llasa-1B轉換而來的GGUF格式模型,主要用於文本轉語音任務。
語音合成 支持多種語言
L
NikolayKozloff
16
3
Outetts 0.3 1B GGUF
OuteTTS-0.3-1B是由OuteAI開發的多語言文本轉語音模型,支持英語、中文、日語、韓語、法語和德語。
語音合成 支持多種語言
O
gaianet
34
0
Outetts 0.3 1B GGUF
OuteTTS-0.3-1B 是一個支持多語言的文本轉語音模型,由 OuteAI 開發,Second State Inc. 進行了量化處理。
語音合成 支持多種語言
O
second-state
151
1
Outetts 0.3 500M GGUF
OuteTTS-0.3-500M 是一個多語言文本轉語音模型,支持英語、中文、日語、韓語、法語和德語。
語音合成 支持多種語言
O
second-state
49
1
Outetts 0.2 500M GGUF
OuteTTS-0.2-500M 是由 OuteAI 開發的多語言文本轉語音模型,支持英語、中文、日語和韓語。
語音合成 支持多種語言
O
gaianet
44
0
Outetts 0.2 500M GGUF
OuteTTS-0.2-500M 是一個多語言文本轉語音模型,支持英語、中文、日語和韓語。
語音合成 支持多種語言
O
second-state
693
0
Fish Speech 1.5 Base
MIT
Fish Speech 1.5 是一個多語言文本轉語音模型,支持多種語言,無需訪問令牌即可使用。
語音合成 支持多種語言
F
None1145
111
4
Hindi Text To Speech Tts
MIT
基於microsoft/speecht5_tts微調的印地語文本轉語音模型
語音合成 Transformers
H
ShigrafS
23
0
XTTS V2 Argentinian Spanish
其他
ⓍTTS是一款語音生成模型,僅需6秒的音頻片段即可克隆聲音並應用於不同語言。無需耗費數小時的大量訓練數據。
語音合成 西班牙語
X
marianbasti
44
5
Mms Tts Nova Train
CC
這是一個撣語(Shan)的文本轉語音(TTS)模型,用於將撣語文本轉換為自然語音。
語音合成 Transformers 其他
M
NorHsangPha
28
0
Speecht5 Tts Commonvoice Ca
MIT
基於SpeechT5架構的加泰羅尼亞語文本轉語音模型,在Common Voice 11.0數據集上微調
語音合成 Transformers 其他
S
wetdog
22
0
Tts Hifigan
HiFiGAN是一種生成對抗網絡(GAN)模型,能夠從梅爾頻譜圖生成高質量音頻,適用於文本轉語音系統。
語音合成 英語
T
nvidia
5,022
36
Hifigan Lj V1
基於LJ Speech數據集訓練的HiFi-GAN聲碼器模型,用於高質量語音合成
語音合成 Transformers 英語
H
jaketae
32
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase