W

Wav2vec2 Xls R 2b 22 To 16

由facebook開發
Facebook的Wav2Vec2 XLS-R模型微調用於多語言語音翻譯任務,支持22種輸入語言和16種輸出語言的互譯。
下載量 38
發布時間 : 3/2/2022

模型概述

這是一個基於SpeechEncoderDecoder架構的語音翻譯模型,能夠將多種口語語言翻譯為書面語言。編碼器基於wav2vec2-xls-r-2b,解碼器基於mbart-large-50,在Covost2數據集上微調。

模型特點

多語言支持
支持22種輸入語言和16種輸出語言的互譯,覆蓋廣泛的語言需求
大規模預訓練
基於20億參數的Wav2Vec2-XLS-R模型,具有強大的語音特徵提取能力
端到端翻譯
直接從語音到目標語言文本的翻譯,無需中間轉錄步驟

模型能力

語音識別
多語言翻譯
語音到文本轉換

使用案例

國際交流
即時語音翻譯
將會議或對話中的語音即時翻譯為其他語言
支持多種語言組合的準確翻譯
媒體處理
視頻字幕生成
為外語視頻自動生成翻譯字幕
支持多種語言對的字幕生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase