W

Wav2vec2 Large Voxrex Swedish 4gram

由 viktor-enzell 开发
这是一个用于瑞典语自动语音识别(ASR)的模型,结合了VoxRex-C声学模型和基于社交媒体数据的4-gram语言模型。
下载量 5,891
发布时间 : 5/26/2022

模型简介

该模型通过添加基于瑞典文化组学十亿词库的4-gram语言模型来增强VoxRex-C声学模型的性能,专门用于瑞典语语音识别任务。

模型特点

增强的语言模型
结合了基于4000万社交媒体词汇的4-gram语言模型,显著提升识别准确率
高性能
在公共语音6.1测试集上达到6.47%的词错误率
预训练声学模型
基于VoxRex-C预训练模型,具有优秀的声学特征提取能力

模型能力

瑞典语语音识别
音频转录
16kHz音频处理

使用案例

语音转录
社交媒体音频转录
将社交媒体平台上的瑞典语语音内容转换为文本
适合处理非正式口语表达
语音助手
用于瑞典语语音助手应用的语音识别组件
高准确率的语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase