W

Whisper Large V3.w4a16

由nm-testing開發
這是openai/whisper-large-v3的量化版本,採用INT4權重量化和FP16激活量化,適用於vLLM推理。
下載量 20
發布時間 : 2/14/2025

模型概述

該模型是Whisper-large-v3的量化版本,主要用於語音識別任務,將音頻轉換為文本。

模型特點

高效量化
採用INT4權重量化和FP16激活量化,顯著減少模型大小和內存佔用
vLLM兼容
專為vLLM >= 0.5.2優化,可實現高效推理
保持高精度
在量化後仍保持接近原始模型的識別準確率

模型能力

語音識別
音頻轉文本
英語轉錄

使用案例

語音轉錄
會議記錄
將會議錄音自動轉換為文字記錄
WER(詞錯誤率)約12.95%
播客轉錄
將播客音頻內容轉換為可搜索的文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase