Orpheus

O

Orpheus

由atharva27開發

基於Llama架構的尖端語音大模型，專為高質量、富有同理心的文本轉語音生成而設計

英語開源協議:Apache-2.0 #零樣本聲音克隆 #情感可控語音合成 #低延遲流式TTS

下載量 20

發布時間 : 5/3/2025

模型概述

經過微調的3B參數TTS模型，可實現人類級別的語音合成效果，在清晰度、表現力和即時流式處理方面表現卓越

模型特點

擬人化語音

自然語調、情感和節奏超越當前閉源最優模型

零樣本聲音克隆

無需預訓練即可克隆聲音

可控情感與語調

通過簡單標籤控制語音情感特徵

低延遲

即時應用場景下約200毫秒流式延遲，輸入流式處理時可降至100毫秒

模型能力

高質量語音合成

情感控制語音生成

即時流式處理

聲音克隆

使用案例

語音合成

有聲讀物生成

生成富有情感的有聲讀物內容

自然流暢的語音輸出

虛擬助手

為虛擬助手提供更自然的語音交互

擬人化的語音響應

即時應用

即時語音播報

用於需要低延遲的即時語音播報場景

200毫秒以下的流式延遲

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase