X

Xls R 300m Te

由chmanoj開發
基於facebook/wav2vec2-xls-r-300m在OpenSLR SLR66泰盧固語數據集上微調的自動語音識別模型
下載量 25
發布時間 : 3/2/2022

模型概述

該模型是針對泰盧固語的自動語音識別(ASR)系統,能夠將泰盧固語語音轉換為文本。

模型特點

高精度泰盧固語識別
在OpenSLR SLR66測試集上達到24.7%的詞錯誤率和4.86%的字錯誤率
基於XLS-R架構
使用facebook的wav2vec2-xls-r-300m作為基礎模型,具有強大的語音特徵提取能力
開源許可
採用Apache-2.0許可證,允許商業和研究用途

模型能力

泰盧固語語音識別
語音轉文本
支持長音頻處理

使用案例

語音轉錄
泰盧固語會議記錄
將泰盧固語會議錄音自動轉換為文字記錄
準確率約75.3%(基於WER指標)
語音助手
為泰盧固語用戶提供語音交互功能
教育
語言學習輔助
幫助學習者練習泰盧固語發音和聽力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase