whisper-large-v2-cantonese開源粵語語音識別模型

Whisper Large V2 Cantonese

由simonl0909開發

基於OpenAI Whisper Large V2在粵語數據集上微調的自動語音識別模型，在測試集上達到6.7274%的字錯誤率

下載量 131

發布時間 : 12/11/2022

模型概述

專門針對粵語優化的語音識別模型，適用於粵語語音轉文字任務

粵語優化

在Common Voice粵語數據集上微調，針對粵語語音識別進行了專門優化

低錯誤率

在測試集上達到6.7274%的字錯誤率(CER)，表現優異

基於Whisper架構

建立在強大的Whisper Large V2基礎模型上，繼承了其優秀的語音識別能力

粵語語音識別

語音轉文字

自動語音轉錄

語音轉錄

粵語會議記錄

將粵語會議內容自動轉錄為文字記錄

字錯誤率6.7274%

粵語媒體字幕生成

為粵語視頻內容自動生成字幕

語音助手

粵語語音交互

支持粵語語音命令識別

屬性	詳情
模型類型	Whisper Large V2 粵語版
訓練數據	mozilla-foundation/common_voice_11_0 粵語數據集
評估指標	字符錯誤率（CER）
基礎模型	openai/whisper-large-v2

任務類型	數據集	評估指標	指標值
自動語音識別	mozilla-foundation/common_voice_11_0（測試集）	字符錯誤率（CER）	6.7274
語音識別	Common Voice zh-HK	測試字符錯誤率（Test CER）	6.7274