U

Ultravox V0 6 Llama 3 3 70b

Developed by fixie-ai
Ultravox是一個多模態語音大語言模型,結合了預訓練大語言模型和語音編碼器,能夠處理語音和文本輸入。
Downloads 196
Release Time : 5/27/2025

Model Overview

Ultravox是一個能夠聆聽和理解語音的大語言模型,可用於語音代理、語音到語音翻譯、語音音頻分析等任務。

Model Features

多模態輸入
可以同時處理語音和文本輸入,支持語音和文本的混合交互。
印地語優化
在擴展的印地語語音數據上進行訓練,顯著提高了印地語的語音理解性能。
噪聲魯棒性
在噪聲數據集上訓練,能夠更好地處理嘈雜音頻,並在無法識別時輸出特殊標記。
未來語音輸出
計劃擴展詞表以支持生成語義和聲學音頻令牌,實現語音輸出功能。

Model Capabilities

語音理解
語音翻譯
語音音頻分析
噪聲檢測
多語言支持

Use Cases

語音交互
語音代理
作為能夠理解語音輸入的智能代理,進行自然語言交互。
語音翻譯
多語言語音翻譯
將一種語言的語音翻譯成另一種語言的文本輸出。
在covost2數據集上取得12.94-42.41 BLEU分數
音頻分析
噪聲檢測
檢測輸入音頻是否包含有效語音或僅為噪聲。
在musan_noise數據集上達到97.45%召回率
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase