M

Mandarin Naive

由GleamEyeBeast開發
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的普通話語音識別模型
下載量 22
發布時間 : 3/2/2022

模型概述

一個針對普通話優化的語音識別模型,基於wav2vec2-xls-r-300m架構微調,在Common Voice數據集上訓練

模型特點

普通話優化
專門針對普通話語音識別任務進行微調
基於wav2vec2架構
採用facebook的wav2vec2-xls-r-300m預訓練模型作為基礎
中等規模
300M參數的模型規模,平衡了性能與計算資源需求

模型能力

普通話語音識別
語音轉文本

使用案例

語音轉錄
普通話語音轉錄
將普通話語音內容轉換為文本
詞錯誤率(WER)0.3999
語音助手
普通話語音指令識別
用於語音助手系統中的指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase