W

Wav2vec2 Large Xlsr Sundanese

由cahya開發
基於facebook/wav2vec2-large-xlsr-53微調的巽他語語音識別模型,訓練數據來自OpenSLR高質量TTS數據集
下載量 339
發布時間 : 3/2/2022

模型概述

這是一個針對巽他語的自動語音識別(ASR)模型,基於Facebook的wav2vec2-large-xlsr-53架構微調而成,專門用於識別巽他語語音輸入。

模型特點

高準確率
在OpenSLR巽他語測試集上達到6.19%的詞錯誤率(WER)
無需語言模型
可直接使用,不需要額外的語言模型支持
16kHz採樣率支持
專門優化用於處理16kHz採樣率的語音輸入

模型能力

巽他語語音識別
音頻轉文本
語音處理

使用案例

語音轉寫
巽他語語音轉錄
將巽他語語音內容轉換為文本
高準確率的轉錄結果
語音助手
巽他語語音接口
為巽他語用戶提供語音控制功能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase