S

S2t Medium Mustc Multilingual St

由facebook開發
基於Transformer的端到端多語言語音翻譯模型,支持英語到多種語言的語音翻譯
下載量 7,322
發布時間 : 3/2/2022

模型概述

該模型採用Transformer架構,專為端到端自動語音識別和語音翻譯設計,通過卷積下采樣器處理語音輸入,並以自迴歸方式生成翻譯結果。

模型特點

多語言支持
支持從英語到8種語言的語音翻譯,包括法語、德語、西班牙語等。
端到端架構
採用端到端設計,直接從語音特徵生成目標語言文本,簡化了傳統流水線系統。
高效語音處理
通過卷積下采樣器將語音輸入長度縮減3/4,提高處理效率。

模型能力

英語語音識別
多語言語音翻譯
自動語音轉文本

使用案例

語音翻譯服務
即時語音翻譯
將英語演講或對話即時翻譯為目標語言文本
在MuST-C測試集上達到24.5-34.9 BLEU分數
多媒體字幕生成
為英語視頻內容生成多語言字幕
語言學習輔助
語言學習工具
幫助語言學習者理解英語語音內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase