L

Llama 3.2 3B Instruct SpinQuant INT4 EO8

由 meta-llama 开发
Llama 3.2是Meta推出的1B和3B参数规模的多语言预训练和指令调优生成模型,针对多语言对话用例优化,支持8种官方语言。
下载量 30.02k
发布时间 : 10/23/2024

模型简介

Llama 3.2包含1B和3B大小的预训练和指令调优生成模型,针对多语言对话用例进行了优化,包括代理检索和摘要任务。

模型特点

多语言支持
官方支持8种语言,训练语言范围更广,开发者可针对其他语言进行微调
高效推理
采用分组查询注意力(GQA)提高推理可扩展性,优化移动设备部署
长上下文处理
支持128k上下文长度,适合处理长文档和复杂对话
量化优化
提供SpinQuant和QLoRA量化方案,显著减少模型大小和提高推理速度

模型能力

多语言文本生成
对话系统
知识检索
文本摘要
提示重写
多轮对话
长文本处理

使用案例

对话助手
多语言聊天机器人
构建支持多种语言的智能对话助手
在8种官方语言上表现优异
内容生成
多语言内容创作
生成多语言的营销文案、社交媒体内容等
支持流畅的文本生成
知识检索
企业知识库问答
基于企业文档构建问答系统
能够准确检索和总结信息
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase