D

Distil Large V3

由 distil-whisper 开发
Distil-Whisper是Whisper large-v3的知识蒸馏版本,专注于英语自动语音识别,提供更快的推理速度同时保持接近原始模型的准确性。
下载量 417.11k
发布时间 : 3/21/2024

模型简介

这是Distil-Whisper英语系列的第三个版本,通过大规模伪标签知识蒸馏技术开发,优化了长格式转录准确性,比前代版本在性能上有显著提升。

模型特点

高效推理
比原始Whisper large-v3模型快6.3倍,比前代distil-large-v2快1.1倍
长格式转录优化
使用顺序长格式算法提供更优的长格式转录准确性
兼容主流库
设计为与Whisper cpp、Faster-Whisper、OpenAI Whisper等流行库兼容

模型能力

英语语音识别
短格式音频转录
长格式音频转录
时间戳生成

使用案例

语音转录
会议记录
将会议录音转换为文字记录
准确率接近原始Whisper large-v3模型
播客转录
将长格式播客内容转换为文字
使用顺序算法时比distil-large-v2高出4.8%准确率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase