L

Llama 3.3 70B Instruct Quantized.w4a16

由RedHatAI開發
基於Meta-Llama-3.1架構的量化優化模型,支持多語言,適用於商業和研究場景,在減少資源需求的同時保持高性能。
下載量 19.25k
發布時間 : 1/2/2025

模型概述

這是一個經過量化優化的70B參數大語言模型,通過INT4權重量化減少75%的存儲和內存需求,支持多種語言的自然語言生成任務。

模型特點

高效量化
採用INT4權重量化技術,減少75%的磁盤大小和GPU內存需求
多語言支持
支持英語、法語、意大利語等8種語言的文本生成
高性能保持
量化後模型在多個基準測試中保持98%以上的原始模型性能
商業友好
適用於商業和研究用途,支持多種部署場景

模型能力

多語言文本生成
對話系統
代碼生成
知識問答
文本摘要

使用案例

對話系統
多語言客服機器人
部署支持多種語言的智能客服系統
在MMLU基準測試中達到80.62%準確率
代碼生成
編程輔助
幫助開發者生成和優化代碼
HumanEval pass@1達到83.40%
教育研究
學術問答系統
構建教育領域的知識問答系統
在ARC Challenge基準測試中達到49.49%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase