🚀 VoxPolska GGUF:下一代波蘭語語音生成
VoxPolska GGUF 是一款專注于波蘭語語音生成的模型,能夠生成貼合波蘭語語境和語調的語音,輸出自然流暢、富有表現力,適用於多種場景。
✨ 主要特性
- 上下文感知語音:生成的語音能夠捕捉波蘭語的細微差別和語調。
- 逼真的語音輸出:產生具有自然語調的流暢且富有表現力的語音,非常適合各種用例。
- 先進的語音合成技術:展示了在生成適合波蘭語的類人語音輸出方面的卓越能力。
- 針對 GGUF 優化:專門針對 GGUF 實現進行了微調,提供快速高效的推理。
- 先進的深度學習技術:採用前沿的深度學習技術,確保在各種應用中實現最佳性能。
🔧 技術細節
屬性 |
詳情 |
基礎模型 |
Orpheus TTS |
LoRA(低秩自適應) |
應用微調以提高性能和效率 |
採樣率 |
24 kHz 音頻輸出,確保高保真聲音 |
訓練數據 |
使用 24000 多個波蘭語轉錄和音頻對進行訓練,確保自然語音生成 |
量化 |
合併 16 位量化,以平衡性能和內存效率 |
音頻解碼 |
自定義逐層處理,用於高質量音頻生成 |
重複懲罰 |
設置為 1.1,以避免重複短語並增強語音自然度 |
梯度檢查點 |
啟用以實現高效內存使用,並在受限環境中加快推理速度 |
💻 使用示例
基礎用法
使用 LM Studio
你需要在計算機上安裝 Python 3.8 或更高版本。
步驟
- 安裝並啟動 LM Studio
- 下載 GGUF 文件
- 下載 4 位版本
- 下載 5 位版本
- 下載 8 位版本
- 如果你想直接從 LM Studio 加載模型,請輸入 salihfurkaan/voxpolska-v1-gguf 並選擇你喜歡的版本。
- 加載 GGUF 文件
- 如果你直接從 LM Studio 加載了模型,請跳過此步驟。否則,請按照以下步驟操作:
- 點擊“我的模型”,你將看到模型目錄,進入該路徑。
- 在“models”文件夾中,創建一個名為“salihfurkaan”的新文件夾並進入該文件夾。
- 在“salihfurkaan”中,創建一個名為“VoxPolska-V1-GGUF”的新文件夾。
- 將你的 gguf 文件放入“VoxPolska-V1-GGUF”文件夾中。
- 啟動本地服務器
- 點擊 LM Studio 上的“開發者”側邊欄。
- 按 CTRL + L 加載模型。
- 按 CTRL + R 啟動本地服務器。
- 克隆 orpheus-tts-local 倉庫並安裝依賴項
git clone https://github.com/isaiahbjork/orpheus-tts-local.git
cd orpheus-tts-local
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
- 將你的 Huggingface 令牌添加到 orpheus-tts-local 文件夾中的文件並保存
import os
os.environ["HF_TOKEN"] = "your huggingface token here"
- 你可以從 [這裡](https://huggingface.co/settings/tokens) 獲取令牌。
- 運行模型
python gguf_orpheus.py --text "Your Polish text here" --output output.wav
你可以在 orpheus-tts-local 文件夾中訪問 output.wav 文件。
可用標誌
--text
:要轉換為語音的文本(必需)
--voice
:要使用的語音(默認是“tara”)
--output
:輸出 WAV 文件路徑(默認:自動生成的文件名)
--temperature
:生成的溫度參數(默認:0.6)
--top_p
:Top-p 採樣參數(默認:0.9)
--repetition_penalty
:重複懲罰(默認:1.1)
--backend
:指定後端(默認:“lmstudio”,也支持“ollama”)
使用 Llama.cpp
你需要在計算機上安裝 CMake。
- 安裝 llama.cpp
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
cmake -B build
cmake --build build --config Release
- 下載 GGUF 文件
- 啟動服務器
./llama-server -m path/to/gguf/file --port 8080
- 克隆 orpheus-tts-local 倉庫並安裝依賴項
git clone https://github.com/isaiahbjork/orpheus-tts-local.git
cd orpheus-tts-local
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
- 將你的 Huggingface 令牌添加到 orpheus-tts-local 文件夾中的文件並保存
import os
os.environ["HF_TOKEN"] = "your huggingface token here"
- 你可以從 [這裡](https://huggingface.co/settings/tokens) 獲取令牌。
- 運行模型
python gguf_orpheus.py --text "Your Polish text here" --output output.wav
你可以在 orpheus-tts-local 文件夾中訪問 output.wav 文件。
📚 詳細文檔
聯繫與支持
如有問題、建議和反饋,請在 HuggingFace 上提出問題。你也可以通過以下方式聯繫:
LinkedIn
模型使用規範
請勿在未經同意的情況下使用此模型進行模仿、傳播錯誤信息或欺騙行為(包括虛假新聞或欺詐性電話),或任何非法或有害活動。使用此模型即表示你同意遵守所有適用的法律和道德準則。
引用
@misc{
title={salihfurkaan/VoxPolska-V1-GGUF},
author={Salih Furkan Erik},
year={2025},
url={https://huggingface.co/salihfurkaan/VoxPolska-GGUF/}
}
📄 許可證
本模型採用 Apache-2.0 許可證。