D

Distil Medium.en

由 distil-whisper 开发
Distil-Whisper是Whisper模型的蒸馏版本,速度比原版快6倍,体积缩小49%,在英语语音识别任务上保持接近原版的性能。
下载量 186.85k
发布时间 : 10/24/2023

模型简介

Distil-Whisper是通过大规模伪标签知识蒸馏技术从Whisper模型获得的轻量级变体,专为高效的英语语音识别而设计。

模型特点

高效推理
速度比原版Whisper快6倍,适合实时应用场景
紧凑模型
体积缩小49%,减少内存和存储需求
高性能
在分布外评估集上性能保持在原版1%词错误率(WER)以内
长格式转录优化
采用分块算法,长格式转录速度比顺序算法快9倍

模型能力

英语语音识别
短格式音频转录(<30秒)
长格式音频转录(>30秒)
推测解码(作为Whisper的辅助模型)

使用案例

语音转录
会议记录
自动转录英语会议内容
高准确率的文字记录
播客转录
将英语播客内容转换为文字
快速生成可搜索的文字内容
辅助技术
实时字幕生成
为英语视频内容生成实时字幕
低延迟的字幕显示
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase