L

Llama 3.3 70B Instruct Quantized.w4a16

由 RedHatAI 开发
基于Meta-Llama-3.1架构的量化优化模型,支持多语言,适用于商业和研究场景,在减少资源需求的同时保持高性能。
下载量 19.25k
发布时间 : 1/2/2025

模型简介

这是一个经过量化优化的70B参数大语言模型,通过INT4权重量化减少75%的存储和内存需求,支持多种语言的自然语言生成任务。

模型特点

高效量化
采用INT4权重量化技术,减少75%的磁盘大小和GPU内存需求
多语言支持
支持英语、法语、意大利语等8种语言的文本生成
高性能保持
量化后模型在多个基准测试中保持98%以上的原始模型性能
商业友好
适用于商业和研究用途,支持多种部署场景

模型能力

多语言文本生成
对话系统
代码生成
知识问答
文本摘要

使用案例

对话系统
多语言客服机器人
部署支持多种语言的智能客服系统
在MMLU基准测试中达到80.62%准确率
代码生成
编程辅助
帮助开发者生成和优化代码
HumanEval pass@1达到83.40%
教育研究
学术问答系统
构建教育领域的知识问答系统
在ARC Challenge基准测试中达到49.49%准确率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase