A

Acip Llama1 7b

Developed by MerantixMomentum
ACIP項目提供的可壓縮版本Llama-7B模型,支持動態調整壓縮率
Downloads 83
Release Time : 4/15/2025

Model Overview

基於jeffwan/llama-7b-hf的可壓縮模型,通過ACIP技術實現參數量的靈活調整,可在不同壓縮率下保持性能

Model Features

動態壓縮
支持通過size_ratio參數即時調整模型壓縮率(0.0-1.0範圍)
可逆壓縮
壓縮操作可逆,可多次調整壓縮率評估性能
量化支持
支持通過bitsandbytes進行4位量化以進一步節省內存

Model Capabilities

文本生成
模型壓縮
量化推理

Use Cases

資源優化
邊緣設備部署
通過壓縮和量化在資源受限設備上部署大模型
內存使用顯著下降
多壓縮率評估
快速測試不同壓縮率下的模型性能
無需重複訓練即可獲得壓縮性能曲線
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase