W

Whisper Large V3 Turbo

由deepdml開發
Whisper large-v3-turbo是OpenAI Whisper large-v3的蒸餾版本,解碼層從32層減少到4層,速度大幅提升但質量略有下降。
下載量 883
發布時間 : 10/1/2024

模型概述

Whisper是由OpenAI開發的最先進的自動語音識別(ASR)和語音翻譯模型,在超過500萬小時的標註數據上訓練,具有強大的泛化能力。

模型特點

高效蒸餾版本
解碼層從32層減少到4層,速度大幅提升但質量略有下降
多語言支持
支持96種語言的語音識別和翻譯
大規模訓練
在超過500萬小時的標註數據上訓練
零樣本泛化能力
在多種數據集和領域展示強大的零樣本泛化能力

模型能力

語音轉文本
語音翻譯
多語言識別
長音頻處理
時間戳預測

使用案例

語音轉錄
會議記錄
將會議錄音自動轉換為文字記錄
高準確率的轉錄文本
播客轉錄
將播客內容轉換為可搜索的文本
支持多種語言的轉錄
語音翻譯
即時翻譯
將外語語音即時翻譯為英語文本
流暢的翻譯結果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase