L

Llama 3.2 1B Instruct

由 meta-llama 开发
Llama 3.2是Meta开发的多语言大语言模型系列,包含1B和3B规模的预训练及指令调优生成模型,针对多语言对话场景优化,支持智能检索和摘要任务。
下载量 2.4M
发布时间 : 9/18/2024

模型简介

Llama 3.2纯文本指令调优模型针对多语言对话场景进行了优化,包括智能检索和摘要任务。在常见行业基准测试中,其表现优于许多开源和闭源聊天模型。

模型特点

多语言支持
支持8种官方语言,训练语言范围更广,可针对更多语言进行微调。
长上下文处理
支持128k的上下文长度,适合处理长文档和复杂对话场景。
高效推理
采用分组查询注意力(GQA)提升推理可扩展性,量化版本适合资源有限设备。
知识蒸馏
整合Llama 3.1 8B和70B模型的logits作为令牌级目标,通过知识蒸馏恢复剪枝后的性能。

模型能力

多语言文本生成
智能检索
文本摘要
对话系统
查询/提示重写

使用案例

智能助手
多语言聊天机器人
构建支持多种语言的对话助手,适用于全球用户。
在官方支持语言中表现优异
移动端AI写作助手
在移动设备上提供实时写作建议和内容生成。
量化版本适合资源有限设备
信息处理
知识检索
从大量文本中快速检索相关信息。
在阅读理解基准测试中表现良好
文本摘要
生成长文档的简洁摘要。
在TLDR9+测试中rougeL得分16.8-19.2
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase