W

Wav2vec2 Large Xlsr 53 Chinese Zh Cn Gpt

由ydshieh開發
基於facebook/wav2vec2-large-xlsr-53在中文(zh-CN)上使用Common Voice數據集進行微調的語音識別模型
下載量 127
發布時間 : 3/2/2022

模型概述

該模型是一個針對中文普通話的自動語音識別(ASR)模型,基於Wav2Vec2架構,在Common Voice的中文數據集上進行了微調,支持簡體中文的語音轉文本任務。

模型特點

多數據集微調
同時使用了Common Voice的zh-CN和zh-TW數據集進行訓練,並將繁體中文轉換為簡體中文
無需語言模型
可直接使用,不需要額外的語言模型支持
標準採樣率支持
支持16kHz的標準語音輸入採樣率

模型能力

中文語音識別
語音轉文本
普通話識別

使用案例

語音轉錄
語音轉寫
將中文語音內容轉換為文本格式
CER 20.90%
語音助手
語音指令識別
識別用戶的中文語音指令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase