W

Whisper Large V3 Turbo Gguf

由 xkeyC 开发
Whisper large-v3-turbo 是基于 Whisper large-v3 的剪枝微调版本,解码层数从32减少到4,速度大幅提升但质量略有下降。
下载量 546
发布时间 : 3/20/2025

模型简介

Whisper 是 OpenAI 开发的最先进的自动语音识别(ASR)和语音翻译模型,经过超过500万小时标注数据训练,具有强大的零样本泛化能力。

模型特点

高效推理
解码层数从32减少到4,推理速度大幅提升
多语言支持
支持超过100种语言的语音识别和翻译
零样本泛化
在未见过的数据集和领域上表现良好
长音频处理
支持分块处理长音频文件

模型能力

语音转文本
多语言语音识别
语音翻译(到英语)
时间戳预测
语言检测

使用案例

语音转录
会议记录
自动转录会议录音为文字记录
准确率高的会议纪要
播客转录
将播客内容转换为可搜索的文本
便于内容检索和分析
语音翻译
实时翻译
将外语语音实时翻译为英语文本
跨语言沟通的桥梁
字幕生成
视频字幕
为视频内容自动生成字幕
提高视频可访问性
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase