A

Acip Llama1 7b

由MerantixMomentum開發
ACIP項目提供的可壓縮版本Llama-7B模型,支持動態調整壓縮率
下載量 83
發布時間 : 4/15/2025

模型概述

基於jeffwan/llama-7b-hf的可壓縮模型,通過ACIP技術實現參數量的靈活調整,可在不同壓縮率下保持性能

模型特點

動態壓縮
支持通過size_ratio參數即時調整模型壓縮率(0.0-1.0範圍)
可逆壓縮
壓縮操作可逆,可多次調整壓縮率評估性能
量化支持
支持通過bitsandbytes進行4位量化以進一步節省內存

模型能力

文本生成
模型壓縮
量化推理

使用案例

資源優化
邊緣設備部署
通過壓縮和量化在資源受限設備上部署大模型
內存使用顯著下降
多壓縮率評估
快速測試不同壓縮率下的模型性能
無需重複訓練即可獲得壓縮性能曲線
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase