A

Acip Llama2 13b

由MerantixMomentum開發
ACIP項目提供的Llama-2-13b可壓縮版本,支持動態調整壓縮率
下載量 27
發布時間 : 4/15/2025

模型概述

基於Llama-2-13b的可壓縮模型,通過ACIP技術實現參數量的靈活調整,支持按需壓縮和量化

模型特點

動態壓縮
支持通過size_ratio參數即時調整壓縮比例(0.0-1.0範圍)
可逆壓縮
壓縮操作可逆,可反覆評估不同壓縮率下的表現
量化支持
支持bitsandbytes的4位量化及其他自定義量化方案

模型能力

文本生成
模型壓縮
動態參數調整

使用案例

資源優化
邊緣設備部署
通過壓縮降低模型體積,適配資源受限環境
可壓縮至原參數量的40%
模型研究
壓縮率影響分析
動態測試不同壓縮率下的性能變化
支持即時調整壓縮比例進行評估
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase