W

Wav2vec2 Xlsr 1b Finnish V2

由aapot開發
基於facebook/wav2vec2-xls-r-1b微調的芬蘭語自動語音識別模型,使用275.6小時芬蘭語標註數據訓練
下載量 15
發布時間 : 3/2/2022

模型概述

針對芬蘭語優化的語音轉文字模型,適用於短音頻轉錄任務

模型特點

大規模預訓練基礎
基於43.6萬小時多語言語音預訓練的10億參數模型微調
高效微調
使用8-bit Adam優化器進行參數高效微調
多源訓練數據
融合議會錄音、廣播、Common Voice等6個芬蘭語數據集
低字符錯誤率
在Common Voice測試集上達到1.65%的字符錯誤率

模型能力

芬蘭語語音識別
短音頻轉錄
語音內容轉文字

使用案例

語音轉錄
會議記錄自動化
將芬蘭語會議錄音轉為文字記錄
詞錯誤率9.73%(無語言模型)
媒體內容字幕生成
為芬蘭語視頻/廣播節目生成字幕
字符錯誤率1.65%
語音助手
芬蘭語語音指令識別
支持芬蘭語智能設備的語音交互
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase