W

Wav2vec2 Xls R 1b Ka

由arampacha開發
基於facebook/wav2vec2-xls-r-1b在格魯吉亞語數據集上微調的自動語音識別模型
下載量 25
發布時間 : 3/2/2022

模型概述

該模型是針對格魯吉亞語優化的自動語音識別(ASR)模型,在Mozilla Common Voice和魯棒語音事件數據集上表現出色

模型特點

高性能語音識別
在格魯吉亞語語音識別任務中取得低詞錯誤率(WER)和字符錯誤率(CER)
大規模預訓練基礎
基於10億參數的wav2vec2-xls-r模型微調,具備強大的語音特徵提取能力
多數據集驗證
在Common Voice和魯棒語音事件等多個數據集上進行了性能驗證

模型能力

格魯吉亞語語音識別
語音轉文本
魯棒語音處理

使用案例

語音轉錄
格魯吉亞語語音轉寫
將格魯吉亞語語音內容轉換為文本
詞錯誤率7.4%,字符錯誤率1.19%
語音助手
格魯吉亞語語音交互
支持格魯吉亞語語音命令識別
在魯棒語音事件數據集上詞錯誤率21.58-22.61%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase