W

Wav2vec2 Xls R 300m Khmer

由vitouphy開發
這是一個基於OpenSLR數據集微調的facebook/wav2vec2-xls-r-300m模型,專門用於高棉語(km)的自動語音識別任務。
下載量 2,321
發布時間 : 3/2/2022

模型概述

該模型是針對高棉語的自動語音識別系統,在有限的數據集(約4小時)上訓練,表現出了不錯的識別能力。

模型特點

小數據高效訓練
僅使用約4小時的訓練數據(實際訓練時長3.2小時)就取得了不錯的識別效果
語言模型支持
支持結合語言模型(kenlm)進行解碼,顯著提升識別準確率
輕量級部署
基於300M參數的模型,相對輕量,適合實際應用部署

模型能力

高棉語語音識別
音頻轉文本
語音內容分析

使用案例

語音轉錄
高棉語語音轉文字
將高棉語語音內容轉換為文字記錄
WER 25.7%, CER 7.03%
語音分析
高棉語語音內容分析
分析高棉語語音中的關鍵詞和內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase