W

Wav2vec2 Large Xls R 300m As V9

由DrishtiSharma開發
基於facebook/wav2vec2-xls-r-300m在阿薩姆語(Common Voice 8.0)數據集上微調的自動語音識別模型
下載量 20
發布時間 : 3/2/2022

模型概述

這是一個針對阿薩姆語的自動語音識別(ASR)模型,基於wav2vec2架構的大規模預訓練模型微調而來,適用於語音轉文本任務。

模型特點

阿薩姆語優化
專門針對阿薩姆語進行微調,在該語言上具有較好的識別性能
大規模預訓練基礎
基於facebook/wav2vec2-xls-r-300m預訓練模型,具有強大的語音特徵提取能力
多場景適應
在Common Voice數據集上訓練,能夠適應多種語音場景

模型能力

阿薩姆語語音識別
語音轉文本
自動語音轉錄

使用案例

語音轉錄
阿薩姆語語音轉寫
將阿薩姆語語音內容轉換為文本
在Common Voice 8.0測試集上WER為61.64%
語音助手
阿薩姆語語音交互
支持阿薩姆語語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase