A

Acip Qwen25 7b

由MerantixMomentum開發
ACIP項目提供的Qwen2.5-7B可壓縮版本,支持動態調整壓縮率並保持模型性能
下載量 80
發布時間 : 4/15/2025

模型概述

基於Qwen2.5-7B的可壓縮語言模型,採用ACIP技術實現參數按需壓縮,支持多語言文本生成任務

模型特點

動態可調壓縮
支持通過size_ratio參數即時調整壓縮比例(0-100%),無需重新加載模型
無損壓縮恢復
壓縮操作可逆,可反覆評估不同壓縮率下的表現,直到確定最終壓縮方案
量化兼容
支持與bitsandbytes等量化工具結合使用,進一步減少內存佔用

模型能力

多語言文本生成
模型壓縮
動態參數調整
量化支持

使用案例

資源優化
邊緣設備部署
通過壓縮和量化在資源受限設備上部署大語言模型
可減少60%以上內存佔用
模型研究
壓縮率影響分析
快速測試不同壓縮率對模型性能的影響
支持即時性能對比
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase