W

Wav2vec2 Xls R 300m Gn Cv8 4

由lgris開發
這是一個基於facebook/wav2vec2-xls-r-300m模型在Common Voice 8.0數據集上微調的自動語音識別(ASR)模型,專門針對瓜拉尼語(gn)優化。
下載量 17
發布時間 : 3/2/2022

模型概述

該模型用於瓜拉尼語的自動語音識別任務,能夠將語音轉換為文本。

模型特點

針對瓜拉尼語優化
專門在瓜拉尼語語音數據集上微調,適合該語言的語音識別任務
基於XLS-R架構
使用facebook的wav2vec2-xls-r-300m作為基礎模型,具備強大的語音特徵提取能力
中等規模模型
300M參數的規模在準確性和計算效率之間取得平衡

模型能力

瓜拉尼語語音識別
語音轉文本

使用案例

語音轉錄
瓜拉尼語語音轉錄
將瓜拉尼語語音內容轉換為文本
在Common Voice 8.0測試集上達到68.45%的詞錯誤率(WER)
語音助手
瓜拉尼語語音指令識別
用於理解瓜拉尼語的語音命令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase