F

Fonxlsr

由chrisjay開發
基於facebook/wav2vec2-large-xlsr-53模型微調的豐語(Fon)語音識別模型,測試WER為14.97%
下載量 56
發布時間 : 3/2/2022

模型概述

這是一個用於豐語(Fon)自動語音識別的模型,基於Wav2Vec2-Large-XLSR-53架構微調而成,支持16kHz採樣率的語音輸入。

模型特點

低詞錯誤率
在豐語測試集上達到14.97%的詞錯誤率(WER)
無需語言模型
可直接使用,無需額外的語言模型支持
專門針對豐語優化
使用豐語數據集進行微調,適合豐語語音識別任務

模型能力

豐語語音識別
16kHz音頻處理

使用案例

語音技術
豐語語音轉文本
將豐語語音轉換為文本內容
詞錯誤率14.97%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase