L

Llama 3.2 3B Instruct SpinQuant INT4 EO8

由meta-llama開發
Llama 3.2是Meta推出的1B和3B參數規模的多語言預訓練和指令調優生成模型,針對多語言對話用例優化,支持8種官方語言。
下載量 30.02k
發布時間 : 10/23/2024

模型概述

Llama 3.2包含1B和3B大小的預訓練和指令調優生成模型,針對多語言對話用例進行了優化,包括代理檢索和摘要任務。

模型特點

多語言支持
官方支持8種語言,訓練語言範圍更廣,開發者可針對其他語言進行微調
高效推理
採用分組查詢注意力(GQA)提高推理可擴展性,優化移動設備部署
長上下文處理
支持128k上下文長度,適合處理長文檔和複雜對話
量化優化
提供SpinQuant和QLoRA量化方案,顯著減少模型大小和提高推理速度

模型能力

多語言文本生成
對話系統
知識檢索
文本摘要
提示重寫
多輪對話
長文本處理

使用案例

對話助手
多語言聊天機器人
構建支持多種語言的智能對話助手
在8種官方語言上表現優異
內容生成
多語言內容創作
生成多語言的營銷文案、社交媒體內容等
支持流暢的文本生成
知識檢索
企業知識庫問答
基於企業文檔構建問答系統
能夠準確檢索和總結信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase