W

Whisper Tiny.en

由openai開發
Whisper是一個預訓練的自動語音識別(ASR)模型,在68萬小時標註數據上訓練,具有強大的泛化能力。
下載量 145.30k
發布時間 : 9/26/2022

模型概述

Whisper是基於Transformer的編碼器-解碼器模型,專門用於英語語音識別任務。

模型特點

大規模訓練
在68萬小時的標註語音數據上訓練,展現出強大的泛化能力
無需微調
可以直接應用於多種數據集和領域,無需進行微調
魯棒性
對口音、背景噪音和技術語言表現出較強的魯棒性

模型能力

英語語音識別
長音頻轉錄(通過分塊處理)

使用案例

語音轉錄
會議記錄
將會議錄音自動轉錄為文字記錄
播客轉錄
將英語播客內容轉換為文字
輔助工具
聽力輔助
為聽障人士提供即時語音轉文字服務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase