W

Wav2vec2 Large Xls R 300m Bn Colab

Developed by rhr99
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_9_0数据集上微调的语音识别模型,支持孟加拉语。
Downloads 18
Release Time : 6/23/2022

Model Overview

这是一个针对孟加拉语优化的语音识别模型,基于wav2vec2-xls-r-300m架构微调而成,适用于语音转文本任务。

Model Features

基于大规模预训练模型微调
在facebook/wav2vec2-xls-r-300m基础上针对孟加拉语进行优化
多语言支持
专注于孟加拉语语音识别,可能保留原模型的多语言能力
高效训练
使用混合精度训练和梯度累积等技术优化训练效率

Model Capabilities

语音识别
音频转文本
孟加拉语处理

Use Cases

语音转录
孟加拉语语音转文字
将孟加拉语语音内容转换为文本
词错误率(WER)0.9861
语音助手
孟加拉语语音指令识别
用于理解孟加拉语语音命令
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase