W

Whisper Large V3 Turbo

由 Daemontatox 开发
Whisper large-v3-turbo 是 OpenAI 提出的自动语音识别和语音翻译模型,基于大规模弱监督训练,支持多种语言。
下载量 26
发布时间 : 2/26/2025

模型简介

Whisper large-v3-turbo 是经过修剪的 Whisper large-v3 微调版本,解码层从32层减少到4层,速度大幅提升但质量略有下降。

模型特点

多语言支持
支持超过100种语言的语音识别和翻译任务。
高效推理
通过减少解码层数,显著提升推理速度,适合实时应用。
零样本泛化能力
在未见过的语言和领域上表现出强大的泛化能力。
长音频处理
支持分块处理长音频文件,适合转录会议、讲座等长时间录音。

模型能力

语音识别
语音翻译
多语言转录
时间戳预测

使用案例

语音转录
会议记录
自动转录会议录音,生成文字记录。
支持多种语言,准确率接近人类水平。
播客转录
将播客内容转录为文字,便于搜索和存档。
可处理不同口音和背景噪声。
语音翻译
实时翻译
将非英语语音实时翻译为英语文本。
支持多种语言到英语的翻译。
辅助工具
字幕生成
为视频内容自动生成字幕。
可生成带时间戳的字幕文件。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase