L

Llama2 22b

由chargoddard開發
基於Llama 2 13B的改進版本,融合了原始Llama 33B的部分注意力頭機制,通過RedPajama數據集微調增強穩定性
下載量 90
發布時間 : 7/22/2023

模型概述

這是一個增強版的大語言模型,結合了Llama 2 13B和原始Llama 33B的優勢,旨在作為進一步調優的基礎平臺

模型特點

混合架構
結合了Llama 2 13B和原始Llama 33B的注意力機制
穩定微調
通過RedPajama約1000萬token的微調使移植結構更穩定
擴展基礎
設計為調優基礎平臺,預期比13B版本有更強學習能力

模型能力

文本生成
語言理解
知識問答

使用案例

研究開發
模型調優基礎
作為進一步調優的基礎模型使用
預期獲得比13B版本更強的學習能力
自然語言處理
文本生成
生成連貫的文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase