W

Wav2vec2 Xlsr Georgian

由sammy786開發
該模型是基於facebook/wav2vec2-xls-r-1b在格魯吉亞語數據集上微調的自動語音識別模型
下載量 19
發布時間 : 3/2/2022

模型概述

基於wav2vec2-xls-r-1b架構的格魯吉亞語自動語音識別模型,在Common Voice 8數據集上微調

模型特點

高性能語音識別
在Common Voice 8格魯吉亞語測試集上達到23.9%的詞錯誤率(WER)
大規模預訓練
基於10億參數的wav2vec2-xls-r-1b模型微調
多場景適應
在對話和魯棒語音事件數據集上進行了評估

模型能力

格魯吉亞語語音轉文本
自動語音識別
對話語音處理

使用案例

語音轉寫
格魯吉亞語語音轉錄
將格魯吉亞語語音轉換為文本
在Common Voice測試集上WER 23.9%
對話系統
格魯吉亞語對話處理
處理格魯吉亞語對話語音
在魯棒語音事件測試集上WER 74.41%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase