Acip Llama1 7b
ACIP項目提供的可壓縮版本Llama-7B模型,支持動態調整壓縮率
Downloads 83
Release Time : 4/15/2025
Model Overview
基於jeffwan/llama-7b-hf的可壓縮模型,通過ACIP技術實現參數量的靈活調整,可在不同壓縮率下保持性能
Model Features
動態壓縮
支持通過size_ratio參數即時調整模型壓縮率(0.0-1.0範圍)
可逆壓縮
壓縮操作可逆,可多次調整壓縮率評估性能
量化支持
支持通過bitsandbytes進行4位量化以進一步節省內存
Model Capabilities
文本生成
模型壓縮
量化推理
Use Cases
資源優化
邊緣設備部署
通過壓縮和量化在資源受限設備上部署大模型
內存使用顯著下降
多壓縮率評估
快速測試不同壓縮率下的模型性能
無需重複訓練即可獲得壓縮性能曲線
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98