Q

Qwen3 30B A3B FP8 Dynamic

RedHatAIによって開発
Qwen3-30B-A3B-FP8-dynamicはQwen3-30B-A3BモデルをFP8量子化で最適化したバージョンで、メモリ要件と計算コストを大幅に削減しながら、元のモデルの高い精度を維持しています。
ダウンロード数 187
リリース時間 : 5/3/2025

モデル概要

このモデルは重みと活性化をFP8形式に量子化することで、メモリ使用量と計算効率を最適化し、推論、関数呼び出し、多言語命令の遵守などのタスクに適しています。

モデル特徴

FP8量子化
重みと活性化の両方をFP8量子化することで、メモリ要件と計算コストを大幅に削減。
効率的な推論
量子化による最適化で、行列乗算の計算スループットが約2倍向上。
高精度維持
量子化後も複数のベンチマークテストで元のモデルの99%以上の精度を維持。
多言語サポート
多言語命令の遵守や翻訳タスクをサポート。

モデル能力

テキスト生成
関数呼び出し
多言語命令遵守
翻訳
ドメイン微調整

使用事例

自然言語処理
テキスト生成
高品質な自然言語テキストを生成
OpenLLMベンチマークで優れた性能を発揮
多言語翻訳
複数の言語間の翻訳タスクをサポート
専門分野アプリケーション
ドメイン専門家の微調整
微調整により特定分野の専門家モデルになることが可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase