W

Wav2vec2 Xlsr 1b Finnish

由aapot開發
基於Facebook的wav2vec2-xls-r-1b模型針對芬蘭語自動語音識別(ASR)進行微調的版本,使用259.57小時芬蘭語標註語音數據訓練
下載量 18
發布時間 : 3/2/2022

模型概述

這是一個針對芬蘭語優化的自動語音識別模型,適用於將芬蘭語語音轉換為文本。

模型特點

大規模預訓練基礎
基於43.6萬小時多語言語音數據預訓練的wav2vec2-xls-r-1b模型
芬蘭語優化
使用259.57小時芬蘭語標註數據專門微調
高效訓練
使用8-bit Adam優化器和混合精度訓練
語言模型支持
提供結合KenLM語言模型的改進版本

模型能力

芬蘭語語音識別
短音頻轉錄(最長20秒)
語音轉文本

使用案例

語音轉錄
會議記錄轉錄
將芬蘭議會會議等正式場合的語音轉換為文本
在議會數據集上表現良好
語音助手
為芬蘭語語音助手提供語音識別能力
語音分析
語音內容分析
分析芬蘭語廣播或播客內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase