🚀 Orpheus-3b-FT-Q2_K
Orpheus-3b-FT-Q2_K 是一个高性能的文本转语音(TTS)模型,它经过微调,能够实现自然、富有情感的语音合成。本项目提供的是该模型 30 亿参数版本的 8 位量化版本,在保证输出高质量语音的同时,优化了推理效率。
🚀 快速开始
下载模型
从 lex-au 的 Orpheus-FASTAPI 集合 下载此量化模型。
加载模型
将模型加载到你选择的大语言模型(LLM)推理服务器中并启动服务器。此量化模型可加载到以下任意 LLM 推理服务器中:
克隆仓库
git clone https://github.com/Lex-au/Orpheus-FastAPI.git
cd Orpheus-FastAPI
配置服务器
配置 FastAPI 服务器以连接到你的推理服务器,方法是设置 ORPHEUS_API_URL
环境变量。
完成安装和设置
遵循 仓库 README 中的完整安装和设置说明。
音频示例
你可以通过以下音频示例,聆听模型使用不同声音和情感进行语音合成的效果:
默认声音示例
莉亚(快乐)
塔拉(悲伤)
扎克(沉思)
✨ 主要特性
- 多种声音选择:提供 8 种具有不同特征的独特声音选项。
- 情感标签支持:支持如笑声、叹息声等情感标签,为语音增添更多表现力。
- GPU 加速优化:针对 RTX 系列 GPU 的 CUDA 加速进行了优化。
- 高质量音频输出:生成 24kHz 的单声道高质量音频。
- 对话自然度微调:经过微调,语音在对话场景中更加自然。
📦 安装指南
此量化模型可加载到以下任意 LLM 推理服务器中:
💻 使用示例
基础用法
该模型设计用于与连接到 Orpheus-FastAPI 前端的 LLM 推理服务器配合使用,该前端提供了 Web UI 和 OpenAI 兼容的 API 端点。
高级用法
你可以在输入文本中插入情感标签,为语音增添更多表现力,例如:
<laugh>
、<chuckle>
:用于笑声。
<sigh>
:用于叹息声。
<cough>
、<sniffle>
:用于轻微的中断声。
<groan>
、<yawn>
、<gasp>
:用于更多的情感表达。
📚 详细文档
可用声音
模型支持 8 种不同的声音:
tara
:女性,对话风格,声音清晰。
leah
:女性,温暖、温柔。
jess
:女性,充满活力,年轻感十足。
leo
:男性,权威,声音深沉。
dan
:男性,友好,风格随意。
mia
:女性,专业,表达清晰。
zac
:男性,热情,富有活力。
zoe
:女性,平静,舒缓。
情感标签
你可以通过插入以下标签为语音增添表现力:
<laugh>
、<chuckle>
:用于笑声。
<sigh>
:用于叹息声。
<cough>
、<sniffle>
:用于轻微的中断声。
<groan>
、<yawn>
、<gasp>
:用于更多的情感表达。
🔧 技术细节
属性 |
详情 |
模型架构 |
专门的令牌到音频序列模型 |
参数数量 |
约 30 亿 |
量化方式 |
8 位(GGUF Q2_K 格式) |
音频采样率 |
24kHz |
输入 |
文本,可选声音选择和情感标签 |
输出 |
高质量 WAV 音频 |
支持语言 |
英语 |
硬件要求 |
支持 CUDA 的 GPU(推荐:RTX 系列) |
集成方式 |
外部 LLM 推理服务器 + Orpheus-FastAPI 前端 |
局限性
- 目前仅支持英文文本。
- 在支持 CUDA 的 GPU 上可实现最佳性能。
- 生成速度取决于 GPU 性能。
📄 许可证
此模型遵循 Apache 许可证 2.0。
引用与归属
原始的 Orpheus 模型由 Canopy Labs 创建。本仓库包含一个经过量化优化的版本,适用于 Orpheus-FastAPI 服务器。
如果你在研究或应用中使用此量化模型,请引用:
@misc{orpheus-tts-2025,
author = {Canopy Labs},
title = {Orpheus-3b-0.1-ft: Text-to-Speech Model},
year = {2025},
publisher = {HuggingFace},
howpublished = {\url{https://huggingface.co/canopylabs/orpheus-3b-0.1-ft}}
}
@misc{orpheus-quantised-2025,
author = {Lex-au},
title = {Orpheus-3b-FT-Q2_K: Quantised TTS Model with FastAPI Server},
note = {GGUF quantisation of canopylabs/orpheus-3b-0.1-ft},
year = {2025},
publisher = {HuggingFace},
howpublished = {\url{https://huggingface.co/lex-au/Orpheus-3b-FT-Q4_K_M.gguf}}
}