W

Whisper Tamil Large V2

由vasista22開發
基於OpenAI Whisper-large-v2微調的泰米爾語語音識別模型,在多個公開泰米爾語ASR語料庫上訓練
下載量 325
發布時間 : 1/1/2023

模型概述

專為泰米爾語優化的自動語音識別模型,適用於各種口音和方言的語音轉錄任務

模型特點

多數據集微調
在6個不同來源的泰米爾語ASR數據集上進行訓練,覆蓋廣泛語音特徵
低詞錯誤率
在Common Voice 11.0測試集上WER僅6.61%,Fleurs測試集WER 7.5%
高效推理支持
提供標準transformers和whisper-jax兩種推理方案,支持批處理和GPU加速

模型能力

泰米爾語語音轉錄
長音頻處理(支持分塊)
口音適應

使用案例

語音轉錄服務
泰米爾語媒體內容字幕生成
為視頻/播客等媒體內容自動生成字幕
在Common Voice測試集上達到93.39%準確率
語音助手開發
泰米爾語語音指令識別
用於開發支持泰米爾語的智能語音助手
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase