W

Whisper Large V2 Onnx Int4 Inc

由Intel開發
Whisper是一個預訓練的自動語音識別(ASR)和語音翻譯模型,經過68萬小時標註數據的訓練,展現出強大的泛化能力。此倉庫包含ONNX格式的Whisper large v2模型的INT4僅權重量化版本。
下載量 19
發布時間 : 10/8/2023

模型概述

Whisper是一個強大的自動語音識別和語音翻譯模型,無需微調即可適應多種數據集和領域。此模型為INT4僅權重量化版本,由英特爾®神經壓縮器驅動。

模型特點

INT4僅權重量化
模型經過INT4僅權重量化,顯著減小模型大小,同時保持較高的識別準確率。
強大的泛化能力
經過68萬小時標註數據的訓練,模型無需微調即可適應多種數據集和領域。
ONNX格式
模型以ONNX格式提供,便於在不同平臺上部署和推理。

模型能力

自動語音識別
語音翻譯

使用案例

語音識別
語音轉文字
將語音內容轉換為文字,適用於會議記錄、字幕生成等場景。
詞錯率低至2.99%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase