W

Wav2vec2hindia

由SAGAR4REAL開發
基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的語音識別模型
下載量 22
發布時間 : 3/28/2022

模型概述

該模型是針對印度語言的語音識別任務進行優化的版本,基於wav2vec2-xls-r-300m架構微調

模型特點

基於XLS-R架構
使用facebook的wav2vec2-xls-r-300m作為基礎模型,具備強大的語音特徵提取能力
印度語言優化
專門針對印度語言進行微調,可能提升相關語言的識別準確率
高效訓練配置
採用混合精度訓練和梯度累積等技術,優化訓練效率

模型能力

語音識別
音頻轉文本
印度語言處理

使用案例

語音轉錄
印度語言語音轉寫
將印度語言的語音內容轉換為文本
語音助手
印度語言語音交互
為印度語言用戶提供語音交互能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase