W

Wav2vec2 Xls R 1b 21 To En

由facebook開發
Facebook的Wav2Vec2 XLS-R模型,用於多語言語音到英語的翻譯任務
下載量 511
發布時間 : 3/2/2022

模型概述

這是一個基於SpeechEncoderDecoder架構的模型,能夠將21種語言的語音翻譯成英語。編碼器基於facebook/wav2vec2-xls-r-1b,解碼器基於facebook/mbart-large-50,在Covost2數據集上進行了微調。

模型特點

多語言支持
支持21種語言到英語的語音翻譯
大規模預訓練
基於20億參數的XLS-R模型,具有強大的語音特徵提取能力
端到端翻譯
直接從語音到目標語言文本的端到端翻譯

模型能力

語音識別
多語言翻譯
語音到文本轉換

使用案例

語音翻譯
即時語音翻譯
將會議、演講等場合的即時語音翻譯成英語
在Covost2數據集上表現優異
多語言語音助手
為語音助手提供多語言輸入支持
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase