W

Wav2vec2 Large Xls R 300m Bas V1

由DrishtiSharma開發
這是一個基於facebook/wav2vec2-xls-r-300m模型在巴薩語(MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - BAS數據集)上微調的自動語音識別模型。
下載量 23
發布時間 : 3/2/2022

模型概述

該模型專門用於巴薩語的自動語音識別任務,在Common Voice 8測試集上取得了35.66%的詞錯誤率(WER)和11.03%的字錯誤率(CER)。

模型特點

巴薩語語音識別
專門針對巴薩語優化的語音識別能力
基於XLS-R架構
使用facebook的wav2vec2-xls-r-300m預訓練模型作為基礎
在Common Voice數據集上微調
使用MOZILLA-FOUNDATION/COMMON_VOICE_8_0的巴薩語數據進行微調

模型能力

巴薩語語音轉文本
自動語音識別

使用案例

語音轉錄
巴薩語語音轉錄
將巴薩語語音轉換為文本
在測試集上WER為35.66%,CER為11.03%
語音助手
巴薩語語音助手
支持巴薩語交互的語音助手應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase