W

Whisper Large V3 Turbo Gguf

由xkeyC開發
Whisper large-v3-turbo 是基於 Whisper large-v3 的剪枝微調版本,解碼層數從32減少到4,速度大幅提升但質量略有下降。
下載量 546
發布時間 : 3/20/2025

模型概述

Whisper 是 OpenAI 開發的最先進的自動語音識別(ASR)和語音翻譯模型,經過超過500萬小時標註數據訓練,具有強大的零樣本泛化能力。

模型特點

高效推理
解碼層數從32減少到4,推理速度大幅提升
多語言支持
支持超過100種語言的語音識別和翻譯
零樣本泛化
在未見過的數據集和領域上表現良好
長音頻處理
支持分塊處理長音頻文件

模型能力

語音轉文本
多語言語音識別
語音翻譯(到英語)
時間戳預測
語言檢測

使用案例

語音轉錄
會議記錄
自動轉錄會議錄音為文字記錄
準確率高的會議紀要
播客轉錄
將播客內容轉換為可搜索的文本
便於內容檢索和分析
語音翻譯
即時翻譯
將外語語音即時翻譯為英語文本
跨語言溝通的橋樑
字幕生成
視頻字幕
為視頻內容自動生成字幕
提高視頻可訪問性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase