L

LLAMA 3 Quantized

由Kameshr開發
Meta Llama 3 - 8B Instruct大語言模型的8位量化版本,減小模型體積並提升推理速度,適合資源有限設備部署。
下載量 18
發布時間 : 5/3/2024

模型概述

基於自迴歸Transformer架構的大語言模型,通過海量文本和代碼訓練,並針對指令跟隨任務進行微調,在對話任務中表現優異。

模型特點

8位量化技術
通過量化減小模型體積並提升推理速度,適合資源有限設備部署
指令微調優化
針對對話場景進行優化,在指令跟隨任務中表現優異
分組查詢注意力(GQA)
提升推理擴展性,優化計算效率

模型能力

文本生成
代碼生成
指令跟隨對話
知識問答
閱讀理解

使用案例

對話助手
客服機器人
用於企業客服場景的智能對話系統
在行業基準測試中超越多數開源聊天模型
教育應用
學習助手
幫助學生解答問題和提供學習資源
在MMLU(5樣本)測試中獲得66.6分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase