S

Seamless M4t V2 Large

由facebook開發
SeamlessM4T v2 是 Facebook 發佈的大規模多語言多模態機器翻譯模型,支持近100種語言的語音和文本翻譯。
下載量 64.59k
發布時間 : 11/29/2023

模型概述

SeamlessM4T 是一個全能的大規模多語言多模態機器翻譯模型,為語音和文本提供高質量的翻譯服務。支持語音到語音、語音到文本、文本到語音、文本到文本翻譯以及自動語音識別等多種任務。

模型特點

多語言支持
支持101種語言的語音輸入、96種語言的文本輸入/輸出、35種語言的語音輸出。
多模態翻譯
支持語音到語音、語音到文本、文本到語音、文本到文本翻譯以及自動語音識別等多種任務。
高質量翻譯
採用新型UnitY2架構,在質量和語音生成任務的推理速度上均優於前代版本。
快速推理
通過分層的字符到單元上採樣和非自迴歸的文本到單元解碼,顯著提升推理速度。

模型能力

語音到語音翻譯
語音到文本翻譯
文本到語音翻譯
文本到文本翻譯
自動語音識別

使用案例

翻譯服務
多語言會議翻譯
即時將會議中的語音翻譯成多種語言的文本或語音輸出。
高質量的多語言翻譯,提升會議效率和溝通效果。
語音內容轉錄
將語音內容自動轉錄為文本,支持多種語言。
準確的語音識別和轉錄,適用於字幕生成、會議記錄等場景。
教育
語言學習輔助
幫助學習者通過語音和文本的互譯進行語言學習。
提供高質量的多語言翻譯,輔助語言學習。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase