W

Wav2vec2 Xls R 1b En To 15

由facebook開發
Facebook的Wav2Vec2 XLS-R模型微調用於語音翻譯任務,支持15種語言從英語到目標語言的翻譯。
下載量 505
發布時間 : 3/2/2022

模型概述

該模型是一個語音編碼器-解碼器模型,能夠將英語口語翻譯為15種不同的書面語言。編碼器基於facebook/wav2vec2-xls-r-1b,解碼器基於facebook/mbart-large-50,並在Covost2數據集上進行了微調。

模型特點

多語言支持
支持從英語到15種不同語言的語音翻譯。
基於XLS-R架構
利用大規模自監督學習的XLS-R架構,提供高質量的語音表示。
端到端翻譯
直接從語音輸入生成目標語言的文本輸出,無需中間轉錄步驟。

模型能力

英語語音識別
多語言文本生成
語音到文本翻譯

使用案例

語音翻譯
即時語音翻譯
將英語口語即時翻譯為多種目標語言的文本。
在Covost2數據集上表現出色。
多語言字幕生成
為英語視頻內容自動生成多語言字幕。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase