W

Wav2vec2 Large Xlsr 53 Hsb

由anuragshas開發
基於facebook/wav2vec2-large-xlsr-53模型微調的上索布語語音識別模型,支持16kHz音頻輸入
下載量 23
發布時間 : 3/2/2022

模型概述

該模型是針對上索布語優化的自動語音識別(ASR)模型,基於Wav2Vec2架構,使用通用語音數據集進行微調。

模型特點

多語言預訓練基礎
基於XLSR-53多語言預訓練模型微調,具有跨語言遷移學習能力
低資源語言支持
專門為上索布語這種低資源語言優化,適用於小語種語音識別場景
端到端識別
無需語言模型即可直接進行語音到文本轉換

模型能力

語音識別
音頻轉文本
上索布語語音處理

使用案例

語音轉錄
上索布語語音轉錄
將上索布語語音內容轉換為文本
詞錯誤率(WER)65.05%
語言保護
少數民族語言數字化
幫助保存和數字化上索布語等少數民族語言
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase