W

Wav2vec2 Large Xlsr 53 Telugu

由anuragshas開發
基於facebook/wav2vec2-large-xlsr-53模型微調的泰盧固語語音識別模型,使用OpenSLR SLR66數據集訓練
下載量 44.24k
發布時間 : 3/2/2022

模型概述

這是一個針對泰盧固語的自動語音識別(ASR)模型,基於Wav2Vec2架構,適用於將泰盧固語語音轉換為文本。

模型特點

泰盧固語專用
專門針對泰盧固語優化的語音識別模型
基於XLSR預訓練模型
利用大規模跨語言語音表示學習(XLSR)的預訓練知識
無需語言模型
可直接使用,無需額外語言模型支持

模型能力

泰盧固語語音識別
16kHz音頻處理

使用案例

語音轉文字
泰盧固語語音轉錄
將泰盧固語語音內容轉換為文本
在OpenSLR測試集上達到44.98% WER
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase