W

Wav2vec2 Large Xlsr Hindi

由skylord開發
基於facebook/wav2vec2-large-xlsr-53微調的印地語語音識別模型,支持16kHz採樣率的語音輸入
下載量 82
發布時間 : 3/2/2022

模型概述

該模型是專為印地語優化的自動語音識別(ASR)系統,通過多個印地語數據集微調訓練,可直接用於語音轉文本任務

模型特點

多數據集微調
使用通用語音、印度語TTS和IIITH語音庫三個印地語數據集進行訓練
無需語言模型
可直接使用,無需額外語言模型支持
均衡數據分佈
訓練數據在性別和口音方面分佈均衡(除通用語音數據集偏向男性聲音)

模型能力

印地語語音識別
16kHz採樣率語音處理
端到端語音轉文本

使用案例

語音轉錄
印地語語音轉文字
將印地語語音內容轉換為文本
在自定義數據集上達到17.23% WER
語音助手
印地語語音指令識別
用於印地語語音助手系統的語音指令理解
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase