M

Meta Llama 3.1 8B Instruct Quantized.w4a16

由RedHatAI開發
Meta-Llama-3.1-8B-Instruct的量化版本,經過優化減少磁盤空間和GPU內存需求,適用於英文商業和研究用途的聊天助手場景。
下載量 27.51k
發布時間 : 7/26/2024

模型概述

這是一個經過INT4權重量化的8B參數大語言模型,專為英文聊天助手場景優化,適用於商業和研究用途。

模型特點

高效量化
採用INT4權重量化技術,減少75%的磁盤空間和GPU內存需求
高性能推理
支持vLLM後端部署,實現高效推理
商業用途
專為商業和研究用途優化,適用於助手類聊天場景
多平臺支持
支持在Red Hat AI Inference Server、Red Hat Enterprise Linux AI和Red Hat Openshift AI等多種平臺上部署

模型能力

英文文本生成
多輪對話
知識問答
指令跟隨

使用案例

商業助手
客戶服務聊天機器人
用於處理客戶諮詢和提供信息
能準確理解用戶意圖並提供相關回答
研究工具
知識問答系統
用於學術研究和知識檢索
在MMLU等基準測試中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase