W

Wav2vec2 Large Xls R 300m Sat Final

由 DrishtiSharma 开发
这是一个基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SAT数据集上微调的自动语音识别模型,支持Santali (Ol Chiki)语言。
下载量 28
发布时间 : 3/2/2022

模型简介

该模型是一个自动语音识别(ASR)模型,专门用于Santali (Ol Chiki)语言的语音转文字任务。

模型特点

多语言支持
专门针对Santali (Ol Chiki)语言进行了优化
高性能
在Common Voice 8测试集上取得了34.94%的词错误率(WER)和13.77%的字错误率(CER)
基于大规模预训练
基于facebook/wav2vec2-xls-r-300m模型微调,继承了强大的语音特征提取能力

模型能力

语音识别
Santali (Ol Chiki)语言处理
语音转文字

使用案例

语音转录
Santali语音转录
将Santali语言的语音内容转换为文字
在测试集上达到34.94%的词错误率
语音助手
Santali语音助手
为Santali语言使用者提供语音交互能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase