W

Whisper Tiny

由openai開發
Whisper Tiny是OpenAI開發的自動語音識別(ASR)模型,屬於Whisper系列中最小的版本,參數規模為39M。
下載量 328.82k
發布時間 : 9/26/2022

模型概述

Whisper是一個基於Transformer的編碼器-解碼器模型,用於自動語音識別和語音翻譯任務。該模型在68萬小時的標註語音數據上訓練,展現出強大的泛化能力。

模型特點

大規模弱監督訓練
在68萬小時的標註語音數據上訓練,具有強大的泛化能力
多語言支持
支持多種語言的語音識別和翻譯任務
無需微調
在許多數據集和領域上表現良好,無需進行微調
輕量級模型
Tiny版本僅有39M參數,適合資源有限的環境

模型能力

語音識別
語音翻譯
多語言處理

使用案例

語音轉錄
會議記錄
將會議錄音自動轉錄為文字記錄
在LibriSpeech測試集上WER為7.54(clean)和17.15(other)
播客轉錄
將播客內容轉錄為可搜索的文本
語音翻譯
即時翻譯
將一種語言的語音即時翻譯為另一種語言的文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase