W

Whisper Large V2 Onnx Int4 Inc

Intelによって開発
Whisperは事前学習済みの自動音声認識(ASR)および音声翻訳モデルで、68万時間の注釈付きデータでトレーニングされ、強力な汎化能力を示しています。このリポジトリには、ONNX形式のWhisper large v2モデルのINT4重みのみ量子化バージョンが含まれています。
ダウンロード数 19
リリース時間 : 10/8/2023

モデル概要

Whisperは強力な自動音声認識および音声翻訳モデルで、微調整なしでさまざまなデータセットやドメインに適応できます。このモデルはINT4重みのみ量子化バージョンで、インテル® Neural Compressorによって駆動されています。

モデル特徴

INT4重みのみ量子化
モデルはINT4重みのみ量子化されており、モデルサイズを大幅に削減しながら高い認識精度を維持しています。
強力な汎化能力
68万時間の注釈付きデータでトレーニングされており、微調整なしでさまざまなデータセットやドメインに適応できます。
ONNX形式
モデルはONNX形式で提供されており、さまざまなプラットフォームでの展開と推論が容易です。

モデル能力

自動音声認識
音声翻訳

使用事例

音声認識
音声からテキストへ
音声コンテンツをテキストに変換し、会議議事録や字幕生成などのシナリオに適用できます。
単語誤り率は2.99%まで低減
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase