U

Ultravox V0 5 Llama 3 3 70b

由fixie-ai開發
Ultravox是基於Llama3.3-70B和Whisper構建的多模態語音大語言模型,支持語音和文本輸入,適用於語音代理、翻譯等場景。
下載量 3,817
發布時間 : 1/31/2025

模型概述

Ultravox是多模態模型,可同時接收語音和文本輸入,通過特殊偽標記實現語音嵌入融合,生成文本輸出。未來版本計劃支持語音生成。

模型特點

多模態輸入支持
可同時處理語音和文本輸入,通過特殊標記實現語音嵌入融合
多語言支持
支持40多種語言的語音和文本處理
高性能翻譯
在多種語言對的語音翻譯任務中表現優異
未來語音生成能力
計劃未來版本支持生成語義和聲學音頻標記,實現語音輸出

模型能力

語音理解
多語言語音識別
語音翻譯
語音代理
語音分析
文本生成

使用案例

語音交互
語音助手
作為智能語音助手解答用戶問題
自然流暢的對話體驗
翻譯服務
即時語音翻譯
將一種語言的語音即時翻譯為另一種語言的文本
在covost2測試集上取得20-49 BLEU分數
內容分析
語音內容分析
分析語音內容並生成摘要或關鍵信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase