H

Hf Seamless M4t Large

由facebook開發
SeamlessM4T 是一個支持多語言語音和文本翻譯的統一模型,能夠實現語音到語音、語音到文本、文本到語音和文本到文本的翻譯任務。
下載量 4,648
發布時間 : 9/13/2023

模型概述

SeamlessM4T 是一個旨在提供高質量翻譯的模型集合,支持多種語言之間的語音和文本翻譯,使不同語言社區的人們能夠輕鬆交流。

模型特點

多任務統一模型
單一模型支持語音到語音、語音到文本、文本到語音和文本到文本的翻譯任務,無需依賴多個獨立模型。
廣泛的語言支持
支持 101 種語言的語音輸入、96 種語言的文本輸入/輸出和 35 種語言的語音輸出。
高質量翻譯
提供高質量的語音和文本翻譯,適用於多種語言對。
靈活的生成策略
支持多種生成策略,如束搜索解碼和多項式採樣,可根據需求調整生成效果。

模型能力

語音到語音翻譯
語音到文本翻譯
文本到語音翻譯
文本到文本翻譯
自動語音識別

使用案例

跨語言交流
即時語音翻譯
將一種語言的語音即時翻譯為另一種語言的語音或文本,適用於會議、旅行等場景。
高質量的多語言語音輸出
多語言內容生成
將文本或語音內容翻譯為多種語言,用於生成多語言媒體內容。
支持多種語言的文本和語音輸出
語音處理
語音識別
將語音轉換為文本,支持多種語言的語音輸入。
高準確率的語音識別
語音合成
將文本轉換為語音,支持多種語言的語音輸出。
自然的語音合成效果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase