L

Llama 3.3 70B Instruct Quantized.w8a8

由 RedHatAI 开发
这是Llama-3.3-70B-Instruct的量化版本模型,支持多语言文本生成,可用于商业和研究场景,在多个基准测试中表现出色。
下载量 19.02k
发布时间 : 1/20/2025

模型简介

Llama-3.3-70B-Instruct的量化版本,通过INT8量化优化了权重和激活,减少了GPU内存需求并提高了计算吞吐量,同时保持了原始模型的性能。

模型特点

多语言支持
支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语、泰语等多种语言的文本生成。
量化优化
对权重和激活进行INT8量化,减少GPU内存需求约50%,提高矩阵乘法计算吞吐量约2倍,同时磁盘大小需求减少约50%。
广泛评估
在多个基准测试中进行了评估,如OpenLLM v1、OpenLLM v2、HumanEval和HumanEval+,与未量化模型相比表现出色。

模型能力

多语言文本生成
商业和研究用途
聊天助手场景

使用案例

商业和研究
多语言聊天助手
用于构建支持多种语言的聊天助手,适用于全球化的商业和研究场景。
在多语言MMLU测试中表现优异,恢复率接近100%。
代码生成
用于生成和补全代码,支持多种编程语言。
在HumanEval和HumanEval+测试中pass@1得分超过80%。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase