X

Xls R Et

由shpotes開發
基於wav2vec2-xls-r-300m架構微調的愛沙尼亞語自動語音識別模型,在Common Voice 7.0數據集上訓練
下載量 23
發布時間 : 3/2/2022

模型概述

該模型是針對愛沙尼亞語優化的自動語音識別(ASR)系統,能夠將愛沙尼亞語音頻轉換為文本

模型特點

多數據集驗證
在Common Voice 7.0和魯棒語音賽事數據集上進行了全面評估
高效訓練
使用混合精度訓練和餘弦學習率調度優化訓練過程
低字符錯誤率
在測試集上達到7.54%的字錯誤率(CER)

模型能力

愛沙尼亞語音頻轉文本
語音識別
語音轉錄

使用案例

語音轉錄
語音備忘錄轉錄
將愛沙尼亞語語音備忘錄轉換為可搜索的文本
在Common Voice測試集上達到34.75%的詞錯誤率
輔助技術
語音輸入系統
為愛沙尼亞語用戶提供語音輸入支持
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase