L

LLAMA 3 Quantized

Developed by Kameshr
Meta Llama 3 - 8B Instruct大语言模型的8位量化版本,减小模型体积并提升推理速度,适合资源有限设备部署。
Downloads 18
Release Time : 5/3/2024

Model Overview

基于自回归Transformer架构的大语言模型,通过海量文本和代码训练,并针对指令跟随任务进行微调,在对话任务中表现优异。

Model Features

8位量化技术
通过量化减小模型体积并提升推理速度,适合资源有限设备部署
指令微调优化
针对对话场景进行优化,在指令跟随任务中表现优异
分组查询注意力(GQA)
提升推理扩展性,优化计算效率

Model Capabilities

文本生成
代码生成
指令跟随对话
知识问答
阅读理解

Use Cases

对话助手
客服机器人
用于企业客服场景的智能对话系统
在行业基准测试中超越多数开源聊天模型
教育应用
学习助手
帮助学生解答问题和提供学习资源
在MMLU(5样本)测试中获得66.6分
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase