W

Wav2vec2 Large Xls R 300m Sat A3

由 DrishtiSharma 开发
基于Facebook的wav2vec2-xls-r-300m模型在桑塔利语(Ol Chiki)语音数据集上微调的自动语音识别(ASR)模型
下载量 29
发布时间 : 3/2/2022

模型简介

该模型是针对桑塔利语优化的自动语音识别系统,在Common Voice 8数据集上训练,支持将桑塔利语语音转换为文本

模型特点

桑塔利语优化
专门针对桑塔利语(Ol Chiki)进行微调,提供更好的语音识别准确率
基于XLS-R架构
使用Facebook强大的wav2vec2-XLS-R-300m作为基础模型
多场景适用
在Common Voice数据集上表现良好,适用于多种语音识别场景

模型能力

桑塔利语语音识别
语音转文本
自动语音识别

使用案例

语音转录
桑塔利语语音转录
将桑塔利语语音内容转换为文本
在Common Voice 8测试集上WER为0.357,CER为0.142
语音助手
桑塔利语语音指令识别
用于桑塔利语语音助手或交互系统
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase