Orpheus 3b 0.1 Ft 16bit
基於羊駝模型的尖端語音大語言模型,專為高質量、富有同理心的文本轉語音生成而設計
語音合成
Transformers Supports Multiple LanguagesOpen Source License:Apache-2.0#零樣本聲音克隆#情感可控語音合成#低延遲流式TTS

Downloads 60
Release Time : 5/1/2025
Model Overview
該模型通過Unsloth和Huggingface的TRL庫實現了2倍速訓練,能夠生成擬人化語音,支持零樣本聲音克隆和情感控制,適用於即時語音合成場景。
Model Features
擬人化語音合成
能夠生成具有自然語調、情感和節奏的語音,超越現有閉源模型
零樣本聲音克隆
無需預訓練即可克隆特定聲音特徵
情感控制
通過簡單標籤控制語音的情感特徵
低延遲處理
即時應用場景下約200毫秒流式延遲,輸入流式處理可降至100毫秒
Model Capabilities
高質量文本轉語音
聲音特徵克隆
情感語音合成
即時流式語音生成
Use Cases
語音合成應用
虛擬助手語音
為虛擬助手生成自然、富有情感的語音
提升用戶體驗和互動質量
有聲讀物製作
自動將文本轉換為富有表現力的語音
降低製作成本,提高生產效率
即時語音交互系統
用於需要低延遲語音反饋的應用場景
實現接近即時的語音交互體驗
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98