I

Indic Seamless

由 ai4bharat 开发
基于SeamlessM4T-v2微调的印度语言语音转文字翻译模型,支持13种印度语言,性能超越基础模型及竞争系统。
下载量 917
发布时间 : 3/4/2025

模型简介

该模型专用于印度语言的语音转文字翻译(STT),在BhasaAnuvaad数据集上微调而成,在Fleurs数据集上创下新纪录。

模型特点

多语言支持
支持13种印度语言,覆盖主要印度语系。
高性能
在Fleurs数据集上创下新纪录,并在BhasaAnuvaad测试集上显著优于其他系统。
严格数据筛选
训练前对数据集进行了对齐分数(0.8)和挖掘分数(0.6)的阈值过滤。

模型能力

语音转文字翻译
多语言语音识别
批量音频处理

使用案例

语音转录
单音频转录
将单个音频文件转录为指定印度语言的文字
准确率高于基础模型和竞争系统
批量处理
数据集批量转录
对Fleurs等语音数据集进行批量转录处理
支持批量处理,效率高
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase