W

Wav2vec2 Xlsr 300m Finnish

由aapot開發
基於facebook/wav2vec2-xls-r-300m針對芬蘭語自動語音識別任務微調的聲學模型,使用275.6小時芬蘭語標註語音數據訓練
下載量 96
發布時間 : 3/2/2022

模型概述

該模型適用於芬蘭語語音轉文本任務,是Wav2Vec2 XLS-R預訓練模型的微調版本,支持芬蘭語自動語音識別。

模型特點

多語言預訓練基礎
基於支持128種語言的Wav2Vec2 XLS-R預訓練模型微調,具有強大的語音表示能力
高效微調
使用275.6小時芬蘭語標註數據進行針對性微調,優化芬蘭語識別效果
支持語言模型增強
可結合KenLM語言模型進一步提升轉錄準確率

模型能力

芬蘭語語音識別
短音頻轉錄(最長20秒)
語音轉文本

使用案例

語音轉錄
議會會議記錄
轉錄芬蘭議會會議音頻內容
在議會數據集上表現良好
日常語音轉寫
將芬蘭語日常對話轉換為文本
對標準發音效果較好,方言識別有限
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase