L

Llama 3.3 70B Instruct Quantized.w4a16

RedHatAIによって開発
Meta-Llama-3.1アーキテクチャに基づく量子化最適化モデルで、多言語をサポートし、商業および研究シーンに適しており、リソース要件を削減しながら高性能を維持します。
ダウンロード数 19.25k
リリース時間 : 1/2/2025

モデル概要

これは量子化最適化された700億パラメータの大規模言語モデルで、INT4重み量子化により75%のストレージとメモリ要件を削減し、複数の言語の自然言語生成タスクをサポートします。

モデル特徴

効率的な量子化
INT4重み量子化技術を採用し、ディスク容量とGPUメモリ要件を75%削減します。
多言語サポート
英語、フランス語、イタリア語など8つの言語のテキスト生成をサポートします。
高性能維持
量子化後のモデルは複数のベンチマークテストで元のモデル性能の98%以上を維持します。
商業に友好的
商業および研究用途に適しており、複数のデプロイシーンをサポートします。

モデル能力

多言語テキスト生成
対話システム
コード生成
知識問答
テキスト要約

使用事例

対話システム
多言語カスタマーサービスロボット
複数の言語をサポートするスマートカスタマーサービスシステムをデプロイします。
MMLUベンチマークテストで80.62%の正解率を達成しました。
コード生成
プログラミング支援
開発者がコードを生成および最適化するのを支援します。
HumanEval pass@1が83.40%に達しました。
教育研究
学術問答システム
教育分野の知識問答システムを構築します。
ARC Challengeベンチマークテストで49.49%の正解率を達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase