W

Whisper Large Zh Cv11

由jonatasgrosman開發
基於openai/whisper-large-v2在中文(普通話)上使用Common Voice 11數據集微調的語音識別模型
下載量 145
發布時間 : 12/18/2022

模型概述

該模型是針對中文(普通話)優化的自動語音識別(ASR)模型,在Common Voice 11數據集上進行了微調,顯著提升了中文語音識別準確率。

模型特點

中文優化
針對中文普通話進行了專門微調,顯著提升了中文語音識別準確率
多場景評估
在Common Voice和Fleurs兩個數據集上進行了全面評估,包含原始文本和標準化文本兩種場景
標點支持
能夠識別並轉錄語音中的標點符號

模型能力

普通話語音識別
標點符號識別
大小寫轉換

使用案例

語音轉寫
會議記錄
將中文會議錄音自動轉寫為文字記錄
在Common Voice測試集上CER為9.55%,WER為55.02%
語音筆記
將個人語音備忘錄轉換為文字
語音助手
中文語音指令識別
用於智能家居或移動設備的中文語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase