D

Distil Medium.en

由distil-whisper開發
Distil-Whisper是Whisper模型的蒸餾版本,速度比原版快6倍,體積縮小49%,在英語語音識別任務上保持接近原版的性能。
下載量 186.85k
發布時間 : 10/24/2023

模型概述

Distil-Whisper是通過大規模偽標籤知識蒸餾技術從Whisper模型獲得的輕量級變體,專為高效的英語語音識別而設計。

模型特點

高效推理
速度比原版Whisper快6倍,適合即時應用場景
緊湊模型
體積縮小49%,減少內存和存儲需求
高性能
在分佈外評估集上性能保持在原版1%詞錯誤率(WER)以內
長格式轉錄優化
採用分塊算法,長格式轉錄速度比順序算法快9倍

模型能力

英語語音識別
短格式音頻轉錄(<30秒)
長格式音頻轉錄(>30秒)
推測解碼(作為Whisper的輔助模型)

使用案例

語音轉錄
會議記錄
自動轉錄英語會議內容
高準確率的文字記錄
播客轉錄
將英語播客內容轉換為文字
快速生成可搜索的文字內容
輔助技術
即時字幕生成
為英語視頻內容生成即時字幕
低延遲的字幕顯示
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase