M

Meta Llama 3.1 405B Instruct FP8 Dynamic

RedHatAIによって開発
Meta-Llama-3.1-405B-InstructのFP8量子化バージョンで、多言語の商業および研究用途に適しており、特にアシスタントロボットシナリオ向けに最適化されています。
ダウンロード数 97
リリース時間 : 7/23/2024

モデル概要

このモデルはMeta-Llama-3.1-405B-Instructの量子化バージョンで、重みと活性化をFP8データ型に量子化することで、ディスクサイズとGPUメモリ要件を約50%削減しました。アシスタントのようなチャットシナリオに適しています。

モデル特徴

FP8量子化
重みと活性化をFP8データ型に量子化し、ディスクサイズとGPUメモリ要件を約50%削減しました。
多言語サポート
英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語など、複数の言語をサポートしています。
高回復率
複数のベンチマークテストでオリジナルモデルに近い性能を達成し、Arena-Hard評価では99.0%の回復率を実現しました。

モデル能力

テキスト生成
多言語対話
数学的推論
多肢選択タスク

使用事例

チャットボット
多言語アシスタント
多言語アシスタントロボットとして、複数の言語での対話やタスク完了をサポートします。
Arena-Hard評価で66.7のスコアを達成しました。
研究ツール
言語モデル研究
大規模言語モデルの性能に及ぼす量子化の影響を研究するために使用されます。
OpenLLM v1およびv2評価でオリジナルモデルに近い性能を達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase