W

Wav2vec2 Base Gujarati Demo

由jaimin開發
這是一個基於facebook/wav2vec2-large-xlsr-53在古吉拉特語上微調的自動語音識別模型,測試WER為28.92%。
下載量 25
發布時間 : 3/2/2022

模型概述

該模型用於古吉拉特語的自動語音識別任務,支持16kHz採樣率的語音輸入。

模型特點

古吉拉特語支持
專門針對古吉拉特語優化的語音識別模型
基於XLSR-53微調
在facebook/wav2vec2-large-xlsr-53基礎上進行微調
16kHz採樣率支持
支持16kHz採樣率的語音輸入處理

模型能力

古吉拉特語語音識別
音頻轉文本

使用案例

語音轉錄
古吉拉特語語音轉錄
將古吉拉特語語音轉換為文本
測試WER為28.92%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase