W

Wav2vec2 Large Xls R 300m Hi Cv8 B2

由DrishtiSharma開發
這是一個基於Facebook的wav2vec2-xls-r-300m模型在印地語Common Voice 8.0數據集上微調的自動語音識別(ASR)模型。
下載量 22
發布時間 : 3/2/2022

模型概述

該模型專門用於印地語的自動語音識別任務,在Common Voice 8.0數據集上訓練,取得了較低的詞錯誤率(WER)。

模型特點

高性能印地語識別
在Common Voice 8.0印地語測試集上取得了38.9%的詞錯誤率(WER)和13.0%的字錯誤率(CER)
基於XLS-R架構
使用Facebook的wav2vec2-XLS-R-300m作為基礎模型,具有強大的語音特徵提取能力
精細調優
經過35輪訓練,使用線性學習率調度和預熱策略優化模型性能

模型能力

印地語語音識別
語音轉文本
魯棒語音事件檢測

使用案例

語音轉錄
印地語語音轉文本
將印地語語音內容轉換為文本
在測試集上達到38.9% WER
語音助手
印地語語音命令識別
識別和理解印地語語音命令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase