W

Wav2vec2 Xls R 2b En To 15

由facebook開發
Facebook的Wav2Vec2 XLS-R模型,針對15種語言的語音翻譯任務進行了微調,能夠將英語口語翻譯為多種書面語言。
下載量 27
發布時間 : 3/2/2022

模型概述

這是一個基於SpeechEncoderDecoderModel的語音翻譯模型,能夠將英語口語翻譯為15種不同的書面語言。模型結合了強大的語音編碼器和文本解碼器,適用於多語言翻譯場景。

模型特點

多語言支持
支持將英語口語翻譯為15種不同的書面語言
大規模預訓練
基於20億參數的Wav2Vec2-XLS-R-2B模型,具有強大的語音理解能力
端到端翻譯
直接從語音到文本的翻譯,無需中間轉錄步驟
高質量翻譯
在Covost2數據集上表現出色,提供準確的翻譯結果

模型能力

英語語音識別
多語言文本翻譯
端到端語音翻譯
支持15種目標語言

使用案例

語音翻譯
即時語音翻譯
將英語口語即時翻譯為目標語言的書面文本
在Covost2數據集上表現優異
多語言會議記錄
將英語會議內容自動翻譯為多種語言的會議記錄
教育應用
語言學習輔助
幫助學習者理解英語口語並將其翻譯為母語
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase