Sheared-LLaMA-1.3B-Pruned開源模型 - 助力研究剪枝技術及其影響

首頁

Sheared LLaMA 1.3B Pruned

由princeton-nlp開發

Sheared-LLaMA-1.3B-Pruned是從Llama-2-7b剪枝得到的1.3B參數模型，未進行繼續預訓練，主要用於研究剪枝技術及其影響。

大型語言模型

Transformers

#剪枝模型 #輕量級LLaMA #研究用途

下載量 25

發布時間 : 1/23/2024

模型概述

該模型是基於Llama-2-7b通過剪枝技術得到的1.3B參數版本，未經過繼續預訓練。主要用於研究剪枝技術、繼續預訓練的數據混合策略，以及評估剪枝對模型知識和推理能力的影響。

模型特點

高效剪枝

從7B參數模型剪枝至1.3B參數，保留了核心能力

研究導向

專門設計用於研究剪枝技術及其對模型能力的影響

輕量級

相比原始7B模型，參數減少約81%，更適合資源有限的研究

模型能力

文本生成

語言理解

使用案例

學術研究

剪枝技術研究

研究不同剪枝方法對LLM性能的影響

知識保留評估

評估剪枝對模型知識和推理能力的保留程度

模型優化

輕量級模型開發

作為開發更小規模LLM的基礎

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Sheared LLaMA 1.3B Pruned

模型概述

模型特點

模型能力

使用案例

🚀 Sheared-LLaMA

🚀 快速開始

相關資源鏈接

📄 許可證

🔧 技術細節