L

Llama 3 8B Instruct GPTQ 4 Bit

astronomerによって開発
これはMeta Llama 3をベースに構築された4ビット量子化GPTQモデルで、Astronomerによって量子化され、低VRAMデバイスで効率的に動作します。
ダウンロード数 2,059
リリース時間 : 4/19/2024

モデル概要

このモデルはMeta-Llama-3-8B-Instructの4ビット量子化バージョンで、リソースが限られたGPU上で効率的に動作するように最適化されており、高い生成品質を維持しています。

モデル特徴

効率的な量子化
4ビットGPTQ量子化技術により、モデルサイズとVRAM要件を大幅に削減しながら、高い生成品質を維持します。
低リソース動作
6GB未満のVRAMを搭載したデバイスで動作可能で、Nvidia T4、K80などのエントリーレベルGPUに適しています。
最適化された推論
vLLMやtext-generation-webuiなどのさまざまな推論フレームワークをサポートし、効率的なテキスト生成サービスを提供します。

モデル能力

命令追従
テキスト生成
質問応答システム
対話システム

使用事例

対話システム
インテリジェントアシスタント
迅速な応答と高い理解力を備えた対話アシスタントを構築
リソースが限られた環境でもスムーズな対話体験を提供可能
コンテンツ生成
テキスト作成
さまざまなタイプのテキストコンテンツを生成
元のモデルの90%以上の生成品質を維持
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase