U

Ultravox V0 4 1 Llama 3 3 70b

由fixie-ai開發
Ultravox是一個基於Llama3.3-70B-Instruct和whisper-large-v3-turbo構建的多模態語音大語言模型,能夠同時處理語音和文本輸入。
下載量 26
發布時間 : 12/16/2024

模型概述

Ultravox是一個多模態模型,能夠同時接收語音和文本輸入,可用於語音代理、語音到語音翻譯、口語音頻分析等任務。

模型特點

多模態輸入
能夠同時接收語音和文本輸入,處理包含特殊偽標記的文本提示。
多語言支持
支持15種語言的語音和文本處理。
高效訓練
僅訓練多模態適配器,Whisper編碼器和Llama保持凍結狀態,提高訓練效率。

模型能力

語音識別
文本生成
語音到語音翻譯
口語音頻分析

使用案例

語音代理
語音助手
作為語音助手回答用戶問題。
語音翻譯
多語言語音翻譯
將一種語言的語音翻譯成另一種語言的文本或語音。
在英語-阿拉伯語翻譯中BLEU得分19.64
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase