W

Whisper Large Onnx Int4 Inc

Intelによって開発
Whisperは自動音声認識(ASR)と音声翻訳のための事前学習済みモデルです。このリポジトリでは、インテル®ニューラルコンプレッサーとインテル®Transformers拡張機能によって駆動されるONNX形式のWhisper大型モデルINT4重み量子化バージョンを提供しています。
ダウンロード数 44
リリース時間 : 10/8/2023

モデル概要

Whisperは68万時間の注釈付きデータで訓練された事前学習済みモデルで、微調整なしでさまざまなデータセットやドメインに適応できる強力な汎化能力を示しています。このモデルはINT4量子化バージョンで、自動音声認識推論に適しています。

モデル特徴

INT4量子化
モデルはINT4重み量子化されており、モデルサイズを大幅に削減(8.8GBから1.9GBへ)しながら高性能を維持しています。
ONNX形式
モデルはONNX形式で提供されており、さまざまなプラットフォームでの展開と推論が容易です。
高性能
量子化されたモデルはlibrispeech_asrデータセットで単語誤り率がわずか3.05%であり、FP32バージョン(3.04%)とほぼ同じ性能です。
微調整不要
モデルは強力な汎化能力を示し、微調整なしでさまざまなデータセットやドメインに適応できます。

モデル能力

自動音声認識
音声翻訳

使用事例

音声認識
音声からテキストへ
音声内容をテキストに変換し、会議議事録や字幕生成などのシナリオに適用できます。
単語誤り率3.05%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase