W

Whisper Large V3 Turbo

由 deepdml 开发
Whisper large-v3-turbo是OpenAI Whisper large-v3的蒸馏版本,解码层从32层减少到4层,速度大幅提升但质量略有下降。
下载量 883
发布时间 : 10/1/2024

模型简介

Whisper是由OpenAI开发的最先进的自动语音识别(ASR)和语音翻译模型,在超过500万小时的标注数据上训练,具有强大的泛化能力。

模型特点

高效蒸馏版本
解码层从32层减少到4层,速度大幅提升但质量略有下降
多语言支持
支持96种语言的语音识别和翻译
大规模训练
在超过500万小时的标注数据上训练
零样本泛化能力
在多种数据集和领域展示强大的零样本泛化能力

模型能力

语音转文本
语音翻译
多语言识别
长音频处理
时间戳预测

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
高准确率的转录文本
播客转录
将播客内容转换为可搜索的文本
支持多种语言的转录
语音翻译
实时翻译
将外语语音实时翻译为英语文本
流畅的翻译结果
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase