M

Meta Llama 3.1 8B Instruct Quantized.w4a16

由 RedHatAI 开发
Meta-Llama-3.1-8B-Instruct的量化版本,经过优化减少磁盘空间和GPU内存需求,适用于英文商业和研究用途的聊天助手场景。
下载量 27.51k
发布时间 : 7/26/2024

模型简介

这是一个经过INT4权重量化的8B参数大语言模型,专为英文聊天助手场景优化,适用于商业和研究用途。

模型特点

高效量化
采用INT4权重量化技术,减少75%的磁盘空间和GPU内存需求
高性能推理
支持vLLM后端部署,实现高效推理
商业用途
专为商业和研究用途优化,适用于助手类聊天场景
多平台支持
支持在Red Hat AI Inference Server、Red Hat Enterprise Linux AI和Red Hat Openshift AI等多种平台上部署

模型能力

英文文本生成
多轮对话
知识问答
指令跟随

使用案例

商业助手
客户服务聊天机器人
用于处理客户咨询和提供信息
能准确理解用户意图并提供相关回答
研究工具
知识问答系统
用于学术研究和知识检索
在MMLU等基准测试中表现优异
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase