wav2vec2-large-xls-r-300m-assamese-cv8開源模型 - 免費實現阿薩姆語語音自動識別

Wav2vec2 Large Xls R 300m Assamese Cv8

由infinitejoy開發

這是一個基於facebook/wav2vec2-xls-r-300m模型在阿薩姆語數據集上微調的自動語音識別(ASR)模型

下載量 18

發布時間 : 3/2/2022

模型概述

該模型是在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - AS數據集上微調的版本，專門用於阿薩姆語的語音識別任務

阿薩姆語專用

專門針對阿薩姆語優化的語音識別模型

基於XLS-R架構

採用facebook的XLS-R-300M大規模預訓練模型作為基礎

Common Voice數據集微調

使用Mozilla Common Voice 8.0的阿薩姆語數據集進行微調

阿薩姆語語音識別

語音轉文本

對話語音處理

語音轉寫

阿薩姆語語音轉錄

將阿薩姆語語音內容轉換為文本

在測試集上WER為65.966，CER為22.188

語音助手

阿薩姆語語音交互

支持阿薩姆語語音指令識別

屬性	詳情
模型類型	XLS-R-300M - 阿薩姆語
訓練數據集	mozilla-foundation/common_voice_8_0
標籤	as、自動語音識別、由訓練器生成、hf-asr-leaderboard、對話模型、mozilla-foundation/common_voice_8_0、魯棒語音事件
許可證	Apache-2.0

任務	數據集	指標	值
自動語音識別	Common Voice 8（MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - AS）	測試詞錯誤率（Test WER）	65.966
自動語音識別	Common Voice 8（MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - AS）	測試字符錯誤率（Test CER）	22.188