W

Wav2vec2 Large XLSR 53 Assamese

由infinitejoy開發
基於facebook/wav2vec2-large-xlsr-53微調的阿薩姆語自動語音識別模型,使用Common Voice數據集訓練
下載量 260
發布時間 : 3/2/2022

模型概述

這是一個針對阿薩姆語的自動語音識別(ASR)模型,基於Facebook的Wav2Vec2-Large-XLSR-53架構微調而成,專門用於將阿薩姆語語音轉換為文本。

模型特點

阿薩姆語專用
專門針對阿薩姆語優化的語音識別模型
基於XLSR-53
利用強大的wav2vec2-large-xlsr-53架構進行微調
Common Voice數據集
使用公開可用的Common Voice數據集進行訓練

模型能力

阿薩姆語語音識別
16kHz音頻處理

使用案例

語音轉文字
阿薩姆語語音轉錄
將阿薩姆語語音內容轉換為文字
在Common Voice測試集上WER為69.63%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase