W

Wav2vec2 Large Xls R 300m Bg D2

由DrishtiSharma開發
基於facebook/wav2vec2-xls-r-300m在保加利亞語數據集上微調的自動語音識別模型
下載量 20
發布時間 : 3/2/2022

模型概述

該模型是針對保加利亞語的自動語音識別(ASR)模型,在Common Voice 8.0數據集上進行了微調,能夠將保加利亞語音頻轉換為文本。

模型特點

高性能保加利亞語識別
在Common Voice 8.0測試集上WER為28.78%,CER為6.86%,表現優異
基於大規模預訓練模型
基於facebook的wav2vec2-xls-r-300m模型微調,繼承了強大的語音特徵提取能力
多數據集驗證
除了Common Voice數據集外,還在魯棒語音事件數據集上進行了驗證

模型能力

保加利亞語音頻轉文本
長音頻處理(支持分塊處理)
語音識別評估

使用案例

語音轉錄
保加利亞語語音轉文字
將保加利亞語的語音內容轉換為可編輯的文本
在標準測試集上準確率較高
語音助手
保加利亞語語音指令識別
用於構建保加利亞語語音助手的基礎識別模塊
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase