A

Acip Qwen25 3b

由MerantixMomentum開發
ACIP項目提供的Qwen2.5-3B可壓縮版本,支持動態調整模型大小並保持性能
下載量 31
發布時間 : 4/15/2025

模型概述

基於Qwen2.5-3B的可壓縮模型,通過ACIP技術實現靈活的參數壓縮與量化,適用於多語言文本生成任務

模型特點

動態可壓縮性
支持通過size_ratio參數即時調整模型壓縮比例(0-100%),且壓縮操作可逆
量化支持
集成bitsandbytes的4比特量化方案,可進一步降低顯存佔用
多語言支持
原生支持13種語言的文本生成任務

模型能力

文本生成
模型壓縮
量化推理

使用案例

資源受限環境部署
邊緣設備部署
通過壓縮和量化將大模型部署到顯存有限的設備
可降低60%以上顯存佔用
多語言應用
多語言文本生成
支持13種語言的文本生成與創作
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase