T

Test Audio

由joaogante開發
一個基於Transformer的端到端語音翻譯模型,專門用於法語到英語的語音翻譯任務。
下載量 19
發布時間 : 5/16/2022

模型概述

該模型是一個序列到序列的語音到文本轉換器,專為法語語音到英語文本的翻譯而設計。它使用卷積下采樣器處理語音輸入,並通過Transformer架構生成翻譯文本。

模型特點

端到端語音翻譯
直接從語音輸入生成翻譯文本,無需中間轉錄步驟。
基於Transformer架構
採用先進的Transformer架構,能夠有效捕捉語音和文本之間的長距離依賴關係。
卷積下采樣
使用卷積下采樣器在語音特徵進入編碼器前減少其長度,提高處理效率。

模型能力

法語語音識別
法語到英語語音翻譯
端到端語音處理

使用案例

語音翻譯服務
即時語音翻譯
將法語語音即時翻譯為英語文本,適用於會議、講座等場景。
在CoVoST2測試集上達到26.25 BLEU分數
語音內容轉錄翻譯
將法語語音內容轉錄並翻譯為英語文本,用於內容本地化。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase