O

Orpheus 3b 0.1 GGUF

由Prince-1開發
基於Llama架構的語音大模型,專為高質量文本轉語音設計,支持情感控制和即時流式傳輸
下載量 423
發布時間 : 4/23/2025

模型概述

Orpheus TTS是基於Llama架構的語音合成模型,通過Unsloth框架和TRL庫實現高效訓練,可生成擬真語音並支持聲音克隆功能

模型特點

擬真語音合成
生成自然語調、情感和節奏,超越當前閉源最優模型
零樣本聲音克隆
無需預訓練即可克隆特定音色
情感語調引導
通過簡單標籤控制語音情感特徵
低延遲流式處理
即時應用場景下約200ms流式延遲,輸入流式傳輸時可降至100ms

模型能力

高質量語音合成
音色克隆
情感語音控制
即時流式傳輸

使用案例

語音交互應用
虛擬助手
為虛擬助手生成自然語音響應
實現人類級語音交互體驗
有聲內容創作
自動生成有聲讀物或播客內容
大幅降低內容製作成本
輔助技術
語音輔助設備
為視障人士提供高質量語音輸出
提升輔助設備使用體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase