W

Whisper Small.en

由openai開發
Whisper是一個預訓練的自動語音識別(ASR)模型,在68萬小時的標註數據上訓練,展現出強大的泛化能力。
下載量 20.50k
發布時間 : 9/26/2022

模型概述

基於Transformer的編碼器-解碼器模型,專門用於英語語音識別任務,無需微調即可適應多種場景。

模型特點

大規模預訓練
在68萬小時的標註語音數據上訓練,涵蓋多樣化的語音場景
零樣本泛化能力
無需微調即可適應多種數據集和領域
魯棒語音識別
對口音、背景噪音和術語表現出強魯棒性

模型能力

英語語音識別
長音頻轉錄(通過分塊處理)
語音活動檢測

使用案例

無障礙工具
即時字幕生成
為聽力障礙用戶提供即時語音轉文字服務
語音分析
會議記錄轉錄
自動轉錄會議錄音為文字記錄
在LibriSpeech測試集上WER為3.05%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase