X

Xlsr 53 Bemba 5hrs

由csikasote開發
基於facebook/wav2vec2-large-xlsr-53微調的語音識別模型,支持Bemba語
下載量 25
發布時間 : 4/29/2022

模型概述

該模型是針對Bemba語優化的自動語音識別(ASR)模型,在5小時Bemba語音數據上微調,適用於低資源語言的語音轉文本任務

模型特點

低資源語言優化
專門針對Bemba這類低資源語言進行優化,僅需5小時訓練數據
基於XLSR架構
利用跨語言語音表示學習(XLSR)的強大能力,實現更好的語音特徵提取
輕量級微調
在大型預訓練模型基礎上進行高效微調,平衡性能與計算成本

模型能力

Bemba語音識別
語音轉文本
低資源語言處理

使用案例

語音轉錄
Bemba語音記錄轉寫
將Bemba語的會議記錄、訪談等內容轉為文字
詞錯誤率(WER)約48.67%
語言保護
瀕危語言數字化
幫助記錄和保護Bemba等低資源語言的語音資料
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase