W

Whisper Small Cantonese

由alvanlii開發
基於OpenAI Whisper-small微調的粵語語音識別模型,在Common Voice 16.0測試集上CER為7.93
下載量 2,413
發布時間 : 12/8/2022

模型概述

專為粵語優化的自動語音識別模型,支持高效準確的粵語語音轉文字

模型特點

優化的粵語識別
針對粵語特點進行專門微調,字符錯誤率(CER)低至7.93
高效推理
支持Flash Attention加速,單樣本處理僅需0.055秒
多格式支持
提供GGML和CT2格式,兼容Whisper.cpp和WhisperX等工具
推測性解碼支持
可作為輔助模型加速大模型的推理過程

模型能力

粵語語音識別
中文語音識別
快速語音轉文字
長音頻處理(支持分塊)

使用案例

語音轉錄
粵語視頻字幕生成
為粵語視頻內容自動生成準確的字幕
CER 7.93的識別準確率
語音助手
構建支持粵語的語音交互應用
快速響應(0.055秒/樣本)
語音分析
粵語語音數據分析
對粵語語音內容進行轉寫和分析
支持多種粵語數據集格式
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase