🚀 Orpheus-3b-FT-Q2_K
Orpheus-3b-FT-Q2_K 是一個高性能的文本轉語音(TTS)模型,它經過微調,能夠實現自然、富有情感的語音合成。本項目提供的是該模型 30 億參數版本的 8 位量化版本,在保證輸出高質量語音的同時,優化了推理效率。
🚀 快速開始
下載模型
從 lex-au 的 Orpheus-FASTAPI 集合 下載此量化模型。
加載模型
將模型加載到你選擇的大語言模型(LLM)推理服務器中並啟動服務器。此量化模型可加載到以下任意 LLM 推理服務器中:
克隆倉庫
git clone https://github.com/Lex-au/Orpheus-FastAPI.git
cd Orpheus-FastAPI
配置服務器
配置 FastAPI 服務器以連接到你的推理服務器,方法是設置 ORPHEUS_API_URL
環境變量。
完成安裝和設置
遵循 倉庫 README 中的完整安裝和設置說明。
音頻示例
你可以通過以下音頻示例,聆聽模型使用不同聲音和情感進行語音合成的效果:
默認聲音示例
莉亞(快樂)
塔拉(悲傷)
扎克(沉思)
✨ 主要特性
- 多種聲音選擇:提供 8 種具有不同特徵的獨特聲音選項。
- 情感標籤支持:支持如笑聲、嘆息聲等情感標籤,為語音增添更多表現力。
- GPU 加速優化:針對 RTX 系列 GPU 的 CUDA 加速進行了優化。
- 高質量音頻輸出:生成 24kHz 的單聲道高質量音頻。
- 對話自然度微調:經過微調,語音在對話場景中更加自然。
📦 安裝指南
此量化模型可加載到以下任意 LLM 推理服務器中:
💻 使用示例
基礎用法
該模型設計用於與連接到 Orpheus-FastAPI 前端的 LLM 推理服務器配合使用,該前端提供了 Web UI 和 OpenAI 兼容的 API 端點。
高級用法
你可以在輸入文本中插入情感標籤,為語音增添更多表現力,例如:
<laugh>
、<chuckle>
:用於笑聲。
<sigh>
:用於嘆息聲。
<cough>
、<sniffle>
:用於輕微的中斷聲。
<groan>
、<yawn>
、<gasp>
:用於更多的情感表達。
📚 詳細文檔
可用聲音
模型支持 8 種不同的聲音:
tara
:女性,對話風格,聲音清晰。
leah
:女性,溫暖、溫柔。
jess
:女性,充滿活力,年輕感十足。
leo
:男性,權威,聲音深沉。
dan
:男性,友好,風格隨意。
mia
:女性,專業,表達清晰。
zac
:男性,熱情,富有活力。
zoe
:女性,平靜,舒緩。
情感標籤
你可以通過插入以下標籤為語音增添表現力:
<laugh>
、<chuckle>
:用於笑聲。
<sigh>
:用於嘆息聲。
<cough>
、<sniffle>
:用於輕微的中斷聲。
<groan>
、<yawn>
、<gasp>
:用於更多的情感表達。
🔧 技術細節
屬性 |
詳情 |
模型架構 |
專門的令牌到音頻序列模型 |
參數數量 |
約 30 億 |
量化方式 |
8 位(GGUF Q2_K 格式) |
音頻採樣率 |
24kHz |
輸入 |
文本,可選聲音選擇和情感標籤 |
輸出 |
高質量 WAV 音頻 |
支持語言 |
英語 |
硬件要求 |
支持 CUDA 的 GPU(推薦:RTX 系列) |
集成方式 |
外部 LLM 推理服務器 + Orpheus-FastAPI 前端 |
侷限性
- 目前僅支持英文文本。
- 在支持 CUDA 的 GPU 上可實現最佳性能。
- 生成速度取決於 GPU 性能。
📄 許可證
此模型遵循 Apache 許可證 2.0。
引用與歸屬
原始的 Orpheus 模型由 Canopy Labs 創建。本倉庫包含一個經過量化優化的版本,適用於 Orpheus-FastAPI 服務器。
如果你在研究或應用中使用此量化模型,請引用:
@misc{orpheus-tts-2025,
author = {Canopy Labs},
title = {Orpheus-3b-0.1-ft: Text-to-Speech Model},
year = {2025},
publisher = {HuggingFace},
howpublished = {\url{https://huggingface.co/canopylabs/orpheus-3b-0.1-ft}}
}
@misc{orpheus-quantised-2025,
author = {Lex-au},
title = {Orpheus-3b-FT-Q2_K: Quantised TTS Model with FastAPI Server},
note = {GGUF quantisation of canopylabs/orpheus-3b-0.1-ft},
year = {2025},
publisher = {HuggingFace},
howpublished = {\url{https://huggingface.co/lex-au/Orpheus-3b-FT-Q4_K_M.gguf}}
}