🚀 VoxPolska GGUF:下一代波兰语语音生成
VoxPolska GGUF 是一款专注于波兰语语音生成的模型,能够生成贴合波兰语语境和语调的语音,输出自然流畅、富有表现力,适用于多种场景。
✨ 主要特性
- 上下文感知语音:生成的语音能够捕捉波兰语的细微差别和语调。
- 逼真的语音输出:产生具有自然语调的流畅且富有表现力的语音,非常适合各种用例。
- 先进的语音合成技术:展示了在生成适合波兰语的类人语音输出方面的卓越能力。
- 针对 GGUF 优化:专门针对 GGUF 实现进行了微调,提供快速高效的推理。
- 先进的深度学习技术:采用前沿的深度学习技术,确保在各种应用中实现最佳性能。
🔧 技术细节
属性 |
详情 |
基础模型 |
Orpheus TTS |
LoRA(低秩自适应) |
应用微调以提高性能和效率 |
采样率 |
24 kHz 音频输出,确保高保真声音 |
训练数据 |
使用 24000 多个波兰语转录和音频对进行训练,确保自然语音生成 |
量化 |
合并 16 位量化,以平衡性能和内存效率 |
音频解码 |
自定义逐层处理,用于高质量音频生成 |
重复惩罚 |
设置为 1.1,以避免重复短语并增强语音自然度 |
梯度检查点 |
启用以实现高效内存使用,并在受限环境中加快推理速度 |
💻 使用示例
基础用法
使用 LM Studio
你需要在计算机上安装 Python 3.8 或更高版本。
步骤
- 安装并启动 LM Studio
- 下载 GGUF 文件
- 下载 4 位版本
- 下载 5 位版本
- 下载 8 位版本
- 如果你想直接从 LM Studio 加载模型,请输入 salihfurkaan/voxpolska-v1-gguf 并选择你喜欢的版本。
- 加载 GGUF 文件
- 如果你直接从 LM Studio 加载了模型,请跳过此步骤。否则,请按照以下步骤操作:
- 点击“我的模型”,你将看到模型目录,进入该路径。
- 在“models”文件夹中,创建一个名为“salihfurkaan”的新文件夹并进入该文件夹。
- 在“salihfurkaan”中,创建一个名为“VoxPolska-V1-GGUF”的新文件夹。
- 将你的 gguf 文件放入“VoxPolska-V1-GGUF”文件夹中。
- 启动本地服务器
- 点击 LM Studio 上的“开发者”侧边栏。
- 按 CTRL + L 加载模型。
- 按 CTRL + R 启动本地服务器。
- 克隆 orpheus-tts-local 仓库并安装依赖项
git clone https://github.com/isaiahbjork/orpheus-tts-local.git
cd orpheus-tts-local
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
- 将你的 Huggingface 令牌添加到 orpheus-tts-local 文件夹中的文件并保存
import os
os.environ["HF_TOKEN"] = "your huggingface token here"
- 你可以从 [这里](https://huggingface.co/settings/tokens) 获取令牌。
- 运行模型
python gguf_orpheus.py --text "Your Polish text here" --output output.wav
你可以在 orpheus-tts-local 文件夹中访问 output.wav 文件。
可用标志
--text
:要转换为语音的文本(必需)
--voice
:要使用的语音(默认是“tara”)
--output
:输出 WAV 文件路径(默认:自动生成的文件名)
--temperature
:生成的温度参数(默认:0.6)
--top_p
:Top-p 采样参数(默认:0.9)
--repetition_penalty
:重复惩罚(默认:1.1)
--backend
:指定后端(默认:“lmstudio”,也支持“ollama”)
使用 Llama.cpp
你需要在计算机上安装 CMake。
- 安装 llama.cpp
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
cmake -B build
cmake --build build --config Release
- 下载 GGUF 文件
- 启动服务器
./llama-server -m path/to/gguf/file --port 8080
- 克隆 orpheus-tts-local 仓库并安装依赖项
git clone https://github.com/isaiahbjork/orpheus-tts-local.git
cd orpheus-tts-local
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
- 将你的 Huggingface 令牌添加到 orpheus-tts-local 文件夹中的文件并保存
import os
os.environ["HF_TOKEN"] = "your huggingface token here"
- 你可以从 [这里](https://huggingface.co/settings/tokens) 获取令牌。
- 运行模型
python gguf_orpheus.py --text "Your Polish text here" --output output.wav
你可以在 orpheus-tts-local 文件夹中访问 output.wav 文件。
📚 详细文档
联系与支持
如有问题、建议和反馈,请在 HuggingFace 上提出问题。你也可以通过以下方式联系:
LinkedIn
模型使用规范
请勿在未经同意的情况下使用此模型进行模仿、传播错误信息或欺骗行为(包括虚假新闻或欺诈性电话),或任何非法或有害活动。使用此模型即表示你同意遵守所有适用的法律和道德准则。
引用
@misc{
title={salihfurkaan/VoxPolska-V1-GGUF},
author={Salih Furkan Erik},
year={2025},
url={https://huggingface.co/salihfurkaan/VoxPolska-GGUF/}
}
📄 许可证
本模型采用 Apache-2.0 许可证。