W

Wav2vec2 Large Xlsr Mvc Swahili

由 eddiegulay 开发
该模型是基于facebook/wav2vec2-large-xlsr-53微调的版本,专门用于斯瓦希里语(Swahili)的自动语音识别任务。
下载量 9,413
发布时间 : 11/6/2023

模型简介

这是一个针对斯瓦希里语优化的自动语音识别模型,基于wav2vec2架构,在Common Voice 13.0数据集上进行微调。

模型特点

斯瓦希里语优化
专门针对斯瓦希里语进行微调,提供更好的语音识别性能
基于wav2vec2-large-xlsr-53
基于强大的wav2vec2-large-xlsr-53基础模型,具有良好的语音特征提取能力
低词错误率
在Common Voice测试集上达到0.2的词错误率

模型能力

斯瓦希里语语音识别
音频转录
语音转文本

使用案例

语音转录
斯瓦希里语语音转录
将斯瓦希里语语音内容转换为文本
词错误率0.2
语音助手
斯瓦希里语语音助手
构建支持斯瓦希里语的语音交互系统
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase