W

Whisper Small

由 openai 开发
Whisper是一个预训练的自动语音识别(ASR)和语音翻译模型,经过68万小时标注数据训练,具有强大的泛化能力。
下载量 2.0M
发布时间 : 9/26/2022

模型简介

Whisper是基于Transformer的编码器-解码器模型,支持多语言语音识别和翻译任务,无需微调即可适应多种数据集和领域。

模型特点

大规模弱监督训练
使用68万小时的标注语音数据进行训练,具有强大的泛化能力
多语言支持
支持超过100种语言的语音识别和翻译
零样本适应能力
无需微调即可适应多种数据集和领域
任务灵活性
通过上下文标记可灵活切换语音识别和翻译任务

模型能力

语音识别
语音翻译
多语言处理
自动语音转文本

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
在LibriSpeech测试集上WER为3.43(clean)和7.63(other)
播客转录
将播客内容转换为可搜索的文本
语音翻译
实时翻译
将一种语言的语音实时翻译为另一种语言的文本
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase