W

Whisper Large V3 Turbo

由openai開發
Whisper是由OpenAI開發的最先進的自動語音識別(ASR)和語音翻譯模型,經過超過500萬小時標記數據的訓練,在零樣本設置下展現出強大的泛化能力。
下載量 4.0M
發布時間 : 10/1/2024

模型概述

Whisper large-v3-turbo是Whisper large-v3的剪枝微調版本,解碼層從32層減少到4層,速度大幅提升但質量略有下降。

模型特點

高效推理
通過減少解碼層數實現更快的推理速度,適合即時應用場景
多語言支持
支持90多種語言的語音識別和翻譯
零樣本泛化能力
在未見過的數據集和領域上表現出色
長音頻處理
支持分塊處理長音頻文件,提高處理效率

模型能力

語音轉文本
多語言語音識別
語音翻譯(到英語)
時間戳預測
語言檢測

使用案例

轉錄服務
會議記錄
自動轉錄會議錄音
準確率高,支持多種語言
播客轉錄
將播客內容轉為文字
支持長時間音頻處理
翻譯服務
即時翻譯
將非英語語音即時翻譯為英語文本
翻譯質量接近人工水平
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase