X

Xls R 300m Et

由TalTechNLP開發
基於facebook/wav2vec2-xls-r-300m微調的愛沙尼亞語自動語音識別模型,使用約800小時多樣化數據訓練
下載量 58
發布時間 : 3/2/2022

模型概述

這是一個通用愛沙尼亞語ASR模型,主要用於廣播對話、訪談、講座等場景的語音識別

模型特點

多樣化訓練數據
使用約800小時多樣化的愛沙尼亞語數據訓練,包括廣播語音、自發語音、老年人語音等多種類型
良好性能表現
在Common Voice等測試集上WER為12.5-13.4%,CER為2.7-3.0%,表現優異
專注愛沙尼亞語
專門針對愛沙尼亞語優化,相比通用多語言模型在愛沙尼亞語識別上有更好表現

模型能力

愛沙尼亞語語音識別
廣播語音轉錄
講座內容轉錄

使用案例

媒體內容處理
廣播節目轉錄
將廣播對話、訪談等內容轉錄為文字
WER 6.1-7.9%
教育應用
講座內容記錄
將講座、演講內容自動轉錄為文字
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase