L

LLAMA 3 Quantized

Kameshrによって開発
Meta Llama 3 - 8B Instruct大規模言語モデルの8ビット量子化バージョン、モデルサイズを縮小し推論速度を向上、リソースが限られたデバイスでの展開に適しています。
ダウンロード数 18
リリース時間 : 5/3/2024

モデル概要

自己回帰型Transformerアーキテクチャに基づく大規模言語モデル、大量のテキストとコードで訓練され、命令追従タスク向けにファインチューニングされ、対話タスクで優れた性能を発揮します。

モデル特徴

8ビット量子化技術
量子化によりモデルサイズを縮小し推論速度を向上、リソースが限られたデバイスでの展開に適しています
命令ファインチューニング最適化
対話シナリオ向けに最適化され、命令追従タスクで優れた性能を発揮します
グループ化クエリ注意(GQA)
推論の拡張性を向上させ、計算効率を最適化します

モデル能力

テキスト生成
コード生成
命令追従対話
知識質問応答
読解力

使用事例

対話アシスタント
カスタマーサービスボット
企業のカスタマーサービスシナリオ向けのインテリジェント対話システム
業界ベンチマークテストでほとんどのオープンソースチャットモデルを上回りました
教育アプリケーション
学習アシスタント
学生の質問に答え学習リソースを提供
MMLU(5サンプル)テストで66.6点を獲得しました
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase