W

Whisper Small Cantonese

Developed by alvanlii
基於OpenAI Whisper-small微調的粵語語音識別模型,在Common Voice 16.0測試集上CER為7.93
Downloads 2,413
Release Time : 12/8/2022

Model Overview

專為粵語優化的自動語音識別模型,支持高效準確的粵語語音轉文字

Model Features

優化的粵語識別
針對粵語特點進行專門微調,字符錯誤率(CER)低至7.93
高效推理
支持Flash Attention加速,單樣本處理僅需0.055秒
多格式支持
提供GGML和CT2格式,兼容Whisper.cpp和WhisperX等工具
推測性解碼支持
可作為輔助模型加速大模型的推理過程

Model Capabilities

粵語語音識別
中文語音識別
快速語音轉文字
長音頻處理(支持分塊)

Use Cases

語音轉錄
粵語視頻字幕生成
為粵語視頻內容自動生成準確的字幕
CER 7.93的識別準確率
語音助手
構建支持粵語的語音交互應用
快速響應(0.055秒/樣本)
語音分析
粵語語音數據分析
對粵語語音內容進行轉寫和分析
支持多種粵語數據集格式
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase