X

Xls Asr Vi 40h 1B

由 geninhu 开发
基于facebook/wav2vec2-xls-r-1b在40小时FPT开放语音数据集(FOSD)和公共语音数据集7.0上微调的越南语自动语音识别模型
下载量 23
发布时间 : 3/2/2022

模型简介

该模型是针对越南语的自动语音识别(ASR)任务优化的模型,在有限的数据集上表现出色,支持语言模型集成以提高识别准确率。

模型特点

高效微调
仅使用40小时越南语数据在大型预训练模型上微调,实现高效资源利用
语言模型支持
支持集成4-gram语言模型,显著降低词错误率(WER)和字错误率(CER)
多数据集验证
在VIVOS、公共语音7.0和8.0等多个越南语数据集上进行全面评估

模型能力

越南语语音识别
语音转文本
支持语言模型集成

使用案例

语音转录
越南语语音转写
将越南语语音内容转换为文本
在公共语音7.0测试集上达到25.846% WER
语音助手
越南语语音指令识别
用于越南语语音助手的前端语音识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase