W

Wav2vec2 Xls R Myv A1

由DrishtiSharma開發
該模型是基於facebook/wav2vec2-xls-r-300m在Erzya語言(MYV)數據集上微調的自動語音識別(ASR)模型,在Common Voice 8測試集上取得了65.15%的詞錯誤率(WER)。
下載量 24
發布時間 : 3/2/2022

模型概述

這是一個針對Erzya語言的自動語音識別模型,基於wav2vec2 XLS-R架構微調,適用於將Erzya語音轉換為文本的任務。

模型特點

多語言支持
專門針對Erzya語言優化,適用於低資源語言的語音識別任務
基於XLS-R架構
採用Facebook的wav2vec2 XLS-R 300M參數模型作為基礎,具有強大的語音特徵提取能力
在Common Voice數據集上微調
使用Mozilla Common Voice 8.0的Erzya語言數據進行微調,適應特定語言特點

模型能力

語音轉文本
Erzya語言識別
自動語音識別

使用案例

語音轉寫
Erzya語音轉錄
將Erzya語言的語音內容轉換為文本
在測試集上達到65.15%的詞錯誤率(WER)
語言保護
少數民族語言數字化
幫助記錄和數字化Erzya等少數民族語言的語音資料
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase