R

Relullama 7B

由SparseLLM開發
基於Llama 2 7B微調的ReLU激活稀疏大語言模型,通過動態參數選擇提升計算效率
下載量 5,323
發布時間 : 11/28/2023

模型概述

採用ReLU激活函數的稀疏大語言模型,通過知識蒸餾和聯合優化實現高效推理,適用於英語文本處理任務

模型特點

稀疏計算優化
採用ReLU激活函數實現類似MoE的選擇性參數激活,提升計算效率
聯合優化訓練
同步進行語言建模和知識蒸餾任務,防止過擬合併增強泛化能力
高效推理支持
兼容PowerInfer推理框架,支持CPU稀疏推理加速

模型能力

英語文本生成
語言理解
問答系統
知識推理

使用案例

效率優化
CPU環境推理加速
在資源受限環境中實現高效推理
稀疏推理速度達8.21 token/秒(i9-13900K)
學術研究
稀疏計算研究
為稀疏大語言模型算法研究提供基礎模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase