D

Distil Whisper Small Cantonese

由alvanlii開發
這是一個基於Whisper Small的粵語語音識別蒸餾模型,在Common Voice 16.0上實現了9.7的CER(無標點符號)。
下載量 187
發布時間 : 4/3/2024

模型概述

該模型是Whisper Small的蒸餾版本,專門針對粵語語音識別任務進行了優化,具有更小的模型尺寸和更快的推理速度。

模型特點

高效推理
相比原版Whisper Small模型,推理速度提升約50%,GPU VRAM需求僅約2GB
粵語優化
專門針對粵語語音識別任務進行了訓練和優化
輕量級
通過減少解碼器層數實現了模型壓縮,參數量從242M減少到157M

模型能力

粵語語音識別
語音轉文字
音頻轉錄

使用案例

語音轉錄
粵語會議記錄
將粵語會議錄音自動轉錄為文字
在Common Voice 16.0測試集上達到9.7%的字符錯誤率(CER)
媒體字幕生成
為粵語視頻內容自動生成字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase