V

Vakyansh Wav2vec2 Tamil Tam 250

由Harveenchadha開發
基於Wav2Vec2架構的泰米爾語自動語音識別模型,由Harveen Chadha開發,在4200小時印地語數據上微調
下載量 1,843
發布時間 : 3/2/2022

模型概述

該模型是專為泰米爾語設計的自動語音識別(ASR)系統,基於Facebook的Wav2Vec2架構,通過多語言預訓練模型CLSRIL-23微調而來

模型特點

多語言預訓練基礎
基於CLSRIL-23多語言模型微調,具有跨語言遷移學習能力
大規模訓練數據
使用4200小時的標註語音數據進行訓練
無語言模型依賴
直接輸出識別結果,無需結合外部語言模型
開源可用
完整訓練代碼和模型權重已開源

模型能力

泰米爾語語音識別
16kHz音頻處理
端到端語音轉文本

使用案例

語音轉錄
泰米爾語語音轉寫
將泰米爾語語音內容轉換為文本
詞錯誤率53.64%(Common Voice測試集)
語音助手
泰米爾語語音指令識別
為泰米爾語語音助手提供基礎識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase