W

Whisper Large V3.w4a16

nm-testingによって開発
これはopenai/whisper-large-v3の量子化バージョンで、INT4重み量子化とFP16活性化量子化を採用し、vLLM推論に適しています。
ダウンロード数 20
リリース時間 : 2/14/2025

モデル概要

このモデルはWhisper-large-v3の量子化バージョンで、主に音声認識タスクに使用され、音声をテキストに変換します。

モデル特徴

効率的な量子化
INT4重み量子化とFP16活性化量子化を採用し、モデルサイズとメモリ使用量を大幅に削減
vLLM互換
vLLM >= 0.5.2向けに最適化されており、効率的な推論を実現
高精度を維持
量子化後も元のモデルに近い認識精度を維持

モデル能力

音声認識
音声からテキストへ変換
英語の文字起こし

使用事例

音声文字起こし
会議議事録
会議の録音を自動的に文字記録に変換
WER(単語誤り率)約12.95%
ポッドキャスト文字起こし
ポッドキャストの音声コンテンツを検索可能なテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase