E

Elastic Llama 3.1 8B Instruct

TheStageAIによって開発
Meta-Llama-3.1-8B-Instructの弾性最適化バージョンで、異なる速度と精度のモデルバリアントを提供し、自己展開シナリオに適しています。
ダウンロード数 125
リリース時間 : 4/13/2025

モデル概要

このモデルはMeta-Llama-3.1-8B-Instructの量子化バージョンで、ANNA(自動ニューラルネットワークアクセラレータ)によって生成され、XL、L、M、Sの4つの最適化バージョンを提供します。ユーザーは必要に応じて速度と品質の間で柔軟に選択できます。

モデル特徴

弾性調整
簡単なスライドコントロールでモデルサイズ、遅延、品質を調整でき、XL、L、M、Sの4つの最適化バージョンを提供します。
高性能最適化
DNNコンパイラによる最適化で、数学的に等価なニューラルネットワークを提供し、高品質を維持しながら推論速度を向上させます。
多ハードウェアサポート
H100/L40s GPUやAMD/Intel CPUなど、さまざまなハードウェアプラットフォームをサポートし、事前コンパイルにより即時コンパイル(JIT)が不要です。
互換性
HFライブラリ(transformers/diffusers)と互換性があり、1行のコードで呼び出せ、多言語テキスト生成をサポートします。

モデル能力

多言語テキスト生成
高品質推論
低遅延応答
弾性モデル調整

使用事例

検索エンジン
質問応答システム
検索エンジンとしてユーザーのクエリに応答し、高品質な多言語回答を提供します。
MMLUなどのベンチマークテストで優れた性能を示し、総合知識能力スコアは65.8(Sバージョン)です。
教育
知識説明
DNN量子化の基本原理などの複雑な概念を説明します。
PIQAテストでは物理常識推論能力スコアが77.6(Sバージョン)に達しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase