S

Seamless M4t V2 Large

Developed by facebook
SeamlessM4T v2 是 Facebook 发布的大规模多语言多模态机器翻译模型,支持近100种语言的语音和文本翻译。
Downloads 64.59k
Release Time : 11/29/2023

Model Overview

SeamlessM4T 是一个全能的大规模多语言多模态机器翻译模型,为语音和文本提供高质量的翻译服务。支持语音到语音、语音到文本、文本到语音、文本到文本翻译以及自动语音识别等多种任务。

Model Features

多语言支持
支持101种语言的语音输入、96种语言的文本输入/输出、35种语言的语音输出。
多模态翻译
支持语音到语音、语音到文本、文本到语音、文本到文本翻译以及自动语音识别等多种任务。
高质量翻译
采用新型UnitY2架构,在质量和语音生成任务的推理速度上均优于前代版本。
快速推理
通过分层的字符到单元上采样和非自回归的文本到单元解码,显著提升推理速度。

Model Capabilities

语音到语音翻译
语音到文本翻译
文本到语音翻译
文本到文本翻译
自动语音识别

Use Cases

翻译服务
多语言会议翻译
实时将会议中的语音翻译成多种语言的文本或语音输出。
高质量的多语言翻译,提升会议效率和沟通效果。
语音内容转录
将语音内容自动转录为文本,支持多种语言。
准确的语音识别和转录,适用于字幕生成、会议记录等场景。
教育
语言学习辅助
帮助学习者通过语音和文本的互译进行语言学习。
提供高质量的多语言翻译,辅助语言学习。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase