W

Wav2vec2 Large Xlsr 53 Swedish

由 MehdiHosseiniMoghadam 开发
这是一个基于facebook/wav2vec2-large-xlsr-53模型在瑞典语Common Voice数据集上微调的自动语音识别(ASR)模型。
下载量 24
发布时间 : 3/2/2022

模型简介

该模型专门用于瑞典语的语音识别任务,支持将16kHz采样的语音转换为文本。

模型特点

瑞典语优化
专门针对瑞典语进行微调,提高了瑞典语语音识别的准确性
基于wav2vec2架构
采用Facebook的wav2vec2-large-xlsr-53预训练模型作为基础
16kHz采样率支持
支持处理16kHz采样率的语音输入

模型能力

瑞典语语音识别
语音转文本

使用案例

语音转录
瑞典语语音转录
将瑞典语语音内容转换为文本
在Common Voice sv-SE测试集上WER为41.39%
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase