D

Distil Large V2

由 distil-whisper 开发
Distil-Whisper是Whisper模型的蒸馏版本,速度提升6倍,体积缩小49%,在非分布评估集上的表现仅相差1% WER。
下载量 42.65k
发布时间 : 10/24/2023

模型简介

Distil-Whisper是Whisper模型的蒸馏版本,专为英语语音识别优化,提供高效的自动语音识别能力。

模型特点

高效推理
速度比原始Whisper模型快6倍,适合实时应用。
体积优化
模型体积缩小49%,减少内存占用。
高性能
在非分布评估集上的表现仅比原始模型差1% WER。
长格式转录支持
支持分块算法处理长格式音频,速度比顺序算法快9倍。

模型能力

英语语音识别
短格式音频转录
长格式音频转录
推测解码

使用案例

语音转录
会议记录
将会议录音转换为文字记录。
播客转录
将播客内容转换为文字以便搜索和存档。
辅助技术
实时字幕生成
为视频或直播生成实时字幕。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase