L

Llama 3.3 70B Instruct Quantized.w8a8

RedHatAIによって開発
これはLlama-3.3-70B-Instructの量子化バージョンのモデルで、多言語のテキスト生成をサポートし、ビジネスや研究のシーンで使用でき、複数のベンチマークテストで優れた性能を発揮します。
ダウンロード数 19.02k
リリース時間 : 1/20/2025

モデル概要

Llama-3.3-70B-Instructの量子化バージョンで、INT8量子化により重みと活性化を最適化し、GPUメモリの必要量を削減し、計算スループットを向上させると同時に、元のモデルの性能を維持しています。

モデル特徴

多言語サポート
英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語などの多言語のテキスト生成をサポートします。
量子化最適化
重みと活性化にINT8量子化を適用し、GPUメモリの必要量を約50%削減し、行列乗算の計算スループットを約2倍に向上させると同時に、ディスク容量の必要量も約50%削減します。
広範な評価
OpenLLM v1、OpenLLM v2、HumanEval、HumanEval+などの複数のベンチマークテストで評価され、量子化されていないモデルと比較して優れた性能を発揮します。

モデル能力

多言語テキスト生成
ビジネスと研究用途
チャットアシスタントシーン

使用事例

ビジネスと研究
多言語チャットアシスタント
多言語をサポートするチャットアシスタントを構築するために使用され、グローバルなビジネスや研究のシーンに適しています。
多言語MMLUテストで優れた性能を発揮し、回復率はほぼ100%に近いです。
コード生成
コードの生成と補完に使用され、複数のプログラミング言語をサポートします。
HumanEvalとHumanEval+テストでpass@1のスコアが80%を超えています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase