W

Wav2vec2 Xlsr 1b Finnish Lm

由aapot開發
基於Facebook的wav2vec2-xls-r-1b模型微調的芬蘭語自動語音識別(ASR)模型,使用259.57小時芬蘭語標註數據訓練
下載量 19
發布時間 : 3/2/2022

模型概述

該模型是針對芬蘭語優化的語音轉文本模型,採用10億參數規模的XLS-R架構,配合KenLM語言模型提升識別準確率

模型特點

大規模預訓練基礎
基於43.6萬小時多語言語音數據預訓練的XLS-R架構
高精度芬蘭語識別
在Common Voice測試集上達到5.65% WER和1.2% CER
語言模型增強
包含專門訓練的芬蘭語KenLM 5-gram語言模型
高效訓練
使用8-bit Adam優化器和混合精度訓練技術

模型能力

芬蘭語語音轉文本
短音頻轉錄(≤20秒)
配合語言模型提升識別準確率

使用案例

語音轉錄
會議記錄轉寫
將芬蘭語會議錄音轉換為文字記錄
適合議會演講等正式場合
語音助手
為芬蘭語語音交互系統提供ASR支持
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase