V

Vakyansh Wav2vec2 Hindi Him 4200

由Harveenchadha開發
基於Wav2Vec2架構的印地語自動語音識別模型,由Harveen Chadha開發,在4200小時標註印地語數據上微調
下載量 2,621
發布時間 : 3/2/2022

模型概述

該模型是一個針對印地語優化的自動語音識別(ASR)系統,基於Facebook的Wav2Vec2架構,在CLSRIL-23多語言預訓練模型基礎上微調而成。

模型特點

大規模印地語數據訓練
基於4200小時的標註印地語數據進行微調
多語言預訓練基礎
基於CLSRIL-23多語言預訓練模型進行微調
無需語言模型
可直接使用原始模型進行推理,無需額外語言模型

模型能力

印地語語音識別
16kHz音頻處理

使用案例

語音轉寫
印地語語音轉文本
將印地語語音內容轉換為文本
在Common Voice印地語測試集上WER為33.17%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase