O

Orpheus 3b 0.1 Ft 16bit

Developed by Prince-1
基於羊駝模型的尖端語音大語言模型,專為高質量、富有同理心的文本轉語音生成而設計
Downloads 60
Release Time : 5/1/2025

Model Overview

該模型通過Unsloth和Huggingface的TRL庫實現了2倍速訓練,能夠生成擬人化語音,支持零樣本聲音克隆和情感控制,適用於即時語音合成場景。

Model Features

擬人化語音合成
能夠生成具有自然語調、情感和節奏的語音,超越現有閉源模型
零樣本聲音克隆
無需預訓練即可克隆特定聲音特徵
情感控制
通過簡單標籤控制語音的情感特徵
低延遲處理
即時應用場景下約200毫秒流式延遲,輸入流式處理可降至100毫秒

Model Capabilities

高質量文本轉語音
聲音特徵克隆
情感語音合成
即時流式語音生成

Use Cases

語音合成應用
虛擬助手語音
為虛擬助手生成自然、富有情感的語音
提升用戶體驗和互動質量
有聲讀物製作
自動將文本轉換為富有表現力的語音
降低製作成本,提高生產效率
即時語音交互系統
用於需要低延遲語音反饋的應用場景
實現接近即時的語音交互體驗
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase