W

Wav2vec2 Xlsr 1b Finnish V2

Developed by aapot
基于facebook/wav2vec2-xls-r-1b微调的芬兰语自动语音识别模型,使用275.6小时芬兰语标注数据训练
Downloads 15
Release Time : 3/2/2022

Model Overview

针对芬兰语优化的语音转文字模型,适用于短音频转录任务

Model Features

大规模预训练基础
基于43.6万小时多语言语音预训练的10亿参数模型微调
高效微调
使用8-bit Adam优化器进行参数高效微调
多源训练数据
融合议会录音、广播、Common Voice等6个芬兰语数据集
低字符错误率
在Common Voice测试集上达到1.65%的字符错误率

Model Capabilities

芬兰语语音识别
短音频转录
语音内容转文字

Use Cases

语音转录
会议记录自动化
将芬兰语会议录音转为文字记录
词错误率9.73%(无语言模型)
媒体内容字幕生成
为芬兰语视频/广播节目生成字幕
字符错误率1.65%
语音助手
芬兰语语音指令识别
支持芬兰语智能设备的语音交互
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase