S

Seamless M4t V2 Large

由audo開發
SeamlessM4T是一個大規模多語言多模態機器翻譯模型,支持近100種語言的語音和文本翻譯。
下載量 39
發布時間 : 12/3/2023

模型概述

SeamlessM4T是一個基礎的一體化多語言多模態機器翻譯模型,為語音和文本提供高質量翻譯。支持語音到語音、語音到文本、文本到語音、文本到文本翻譯以及自動語音識別等多種任務。

模型特點

多語言支持
支持101種語言的語音輸入和96種語言的文本輸入/輸出,覆蓋全球主要語言
多模態翻譯
支持語音到語音、語音到文本、文本到語音和文本到文本等多種翻譯模式
高質量翻譯
採用新穎的UnitY2架構,在質量和推理速度上均優於前代版本
快速推理
通過分層的字符到單元上採樣和非自迴歸文本到單元解碼,顯著提升推理速度

模型能力

語音識別
語音合成
文本翻譯
語音翻譯
多語言處理

使用案例

即時翻譯
會議即時翻譯
在跨國會議中提供即時語音翻譯服務
支持多種語言的即時互譯
語音助手
為智能設備提供多語言語音交互能力
實現跨語言的自然對話
內容本地化
視頻字幕生成
自動生成多語言視頻字幕
提高內容可訪問性
多語言播客
將播客內容翻譯成多種語言版本
擴大受眾覆蓋面
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase