W

Whisper Large Onnx Int4 Inc

由Intel開發
Whisper是一種預訓練模型,用於自動語音識別(ASR)和語音翻譯。本倉庫提供ONNX格式的Whisper大型模型INT4權重量化版本,由英特爾®神經壓縮器和英特爾®Transformers擴展驅動。
下載量 44
發布時間 : 10/8/2023

模型概述

Whisper是一種預訓練模型,經過68萬小時標註數據訓練後,展現出強大的泛化能力,無需微調即可適應多種數據集和領域。本模型為INT4量化版本,適用於自動語音識別推理。

模型特點

INT4量化
模型經過INT4權重量化,顯著減小模型大小(從8.8GB降至1.9GB),同時保持高性能。
ONNX格式
模型以ONNX格式提供,便於在不同平臺上部署和推理。
高性能
量化後的模型在librispeech_asr數據集上詞錯誤率僅3.05%,與FP32版本(3.04%)幾乎相同。
無需微調
模型展現出強大的泛化能力,無需微調即可適應多種數據集和領域。

模型能力

自動語音識別
語音翻譯

使用案例

語音識別
語音轉文字
將語音內容轉換為文字,適用於會議記錄、字幕生成等場景。
詞錯誤率3.05%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase