llama2-22b開源AI模型 - 融合優勢微調優化，帶來更穩定使用體驗

首頁

Llama2 22b

由chargoddard開發

基於Llama 2 13B的改進版本，融合了原始Llama 33B的部分注意力頭機制，通過RedPajama數據集微調增強穩定性

大型語言模型

Transformers

#混合注意力頭機制 #RedPajama微調 #知識推理增強

下載量 90

發布時間 : 7/22/2023

模型概述

這是一個增強版的大語言模型，結合了Llama 2 13B和原始Llama 33B的優勢，旨在作為進一步調優的基礎平臺

模型特點

混合架構

結合了Llama 2 13B和原始Llama 33B的注意力機制

穩定微調

通過RedPajama約1000萬token的微調使移植結構更穩定

擴展基礎

設計為調優基礎平臺，預期比13B版本有更強學習能力

模型能力

文本生成

語言理解

知識問答

使用案例

研究開發

模型調優基礎

作為進一步調優的基礎模型使用

預期獲得比13B版本更強的學習能力

自然語言處理

文本生成

生成連貫的文本內容

屬性	詳情
模型類型	llama
任務類型	文本生成
訓練數據集	togethercomputer/RedPajama-Data-1T-Sample
標籤	llama

指標	值
平均值	46.85
ARC (25-shot)	58.53
HellaSwag (10-shot)	82.55
MMLU (5-shot)	54.68
TruthfulQA (0-shot)	39.84
Winogrande (5-shot)	76.32
GSM8K (5-shot)	9.93
DROP (3-shot)	6.08

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Llama2 22b

模型概述

模型特點

模型能力

使用案例

🚀 Llama 2 13b 增強模型

📚 詳細文檔

模型信息

模型說明

Open LLM 排行榜評估結果