L

Llama 3.2 3B Instruct FP8 Dynamic

RedHatAIによって開発
Llama-3.2-3B-InstructのFP8量子化バージョンで、多言語の商業および研究用途に適しており、特にアシスタントのようなチャットシナリオに最適です。
ダウンロード数 986
リリース時間 : 9/25/2024

モデル概要

このモデルはMeta-Llama-3.2-3B-Instructの量子化バージョンで、重みと活性化をFP8データ型に量子化することで、ディスクサイズとGPUメモリ要件を約50%削減しました。

モデル特徴

FP8量子化
重みと活性化をFP8データ型に量子化し、ディスクサイズとGPUメモリ要件を約50%削減。
多言語サポート
英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語など、複数の言語をサポート。
効率的な推論
最適化されたモデルは、vLLMバックエンドを使用した効率的な推論に適しています。

モデル能力

テキスト生成
多言語チャット
商業および研究用途

使用事例

チャットボット
多言語チャットアシスタント
アシスタントのようなチャットシナリオに適しており、複数の言語をサポートします。
OpenLLMベンチマークテストで平均スコアは50.88でした。
商業アプリケーション
ビジネスコンサルティング
ビジネスコンサルティングとQ&Aサービスを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase