L

Lite Whisper Large V3 Acc

由 efficient-speech 开发
Lite-Whisper 是 OpenAI Whisper 的压缩版本,采用 LiteASR 技术,在保持高准确率的同时减小模型大小。
下载量 57
发布时间 : 2/26/2025

模型简介

基于 Whisper-large-v3 的压缩版本,专注于自动语音识别任务,通过优化编码器结构减少模型参数,同时保持与原始模型相近的识别准确率。

模型特点

高效压缩
采用 LiteASR 技术显著减小模型大小,编码器参数从 635M 压缩至 429M
保持高准确率
在 ESB 数据集上平均 WER 10.1,与原始 whisper-large-v3 性能相当
快速推理
相比完整版模型,压缩后模型应具有更快的推理速度(具体数据未提供)

模型能力

语音转文本
多语言语音识别
长音频处理

使用案例

语音转录
会议记录
自动将会议录音转换为文字记录
准确率与原始 Whisper 模型相当
字幕生成
为视频内容自动生成字幕
语音助手
语音指令识别
用于智能设备的语音指令识别系统
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase