D

Distil Small.en

由distil-whisper開發
Distil-Whisper是Whisper模型的蒸餾版本,速度快6倍,體積縮小49%,在非分佈評估集上表現接近1% WER。
下載量 33.51k
發布時間 : 12/6/2023

模型概述

Distil-Whisper是一個自動語音識別(ASR)模型,專門用於英語語音識別。它是Whisper模型的蒸餾版本,優化了推理速度和模型大小,同時保持了較高的識別準確率。

模型特點

高效推理
比原始Whisper模型快6倍,適合即時應用
緊湊模型
體積縮小49%,適合內存受限的設備端應用
高性能
在非分佈評估集上表現接近1% WER
長格式轉錄優化
使用分塊算法,比順序算法快9倍

模型能力

英語語音識別
短格式音頻轉錄(<30秒)
長格式音頻轉錄(>30秒)
推測解碼(作為Whisper的輔助模型)

使用案例

語音轉錄
會議記錄
將會議錄音轉換為文字記錄
快速準確的轉錄結果
播客轉錄
將播客內容轉換為文字
支持長格式音頻的高效轉錄
設備端應用
移動設備語音助手
在手機等移動設備上實現語音識別功能
小體積模型適合設備端部署
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase