D

Distil Large V2

由distil-whisper開發
Distil-Whisper是Whisper模型的蒸餾版本,速度提升6倍,體積縮小49%,在非分佈評估集上的表現僅相差1% WER。
下載量 42.65k
發布時間 : 10/24/2023

模型概述

Distil-Whisper是Whisper模型的蒸餾版本,專為英語語音識別優化,提供高效的自動語音識別能力。

模型特點

高效推理
速度比原始Whisper模型快6倍,適合即時應用。
體積優化
模型體積縮小49%,減少內存佔用。
高性能
在非分佈評估集上的表現僅比原始模型差1% WER。
長格式轉錄支持
支持分塊算法處理長格式音頻,速度比順序算法快9倍。

模型能力

英語語音識別
短格式音頻轉錄
長格式音頻轉錄
推測解碼

使用案例

語音轉錄
會議記錄
將會議錄音轉換為文字記錄。
播客轉錄
將播客內容轉換為文字以便搜索和存檔。
輔助技術
即時字幕生成
為視頻或直播生成即時字幕。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase