Acip Llama31 8b
ACIP項目提供的可壓縮版本Llama-3.1-8B模型,支持動態調整壓縮率並保持性能
Downloads 24
Release Time : 4/15/2025
Model Overview
基於Llama-3.1-8B的可壓縮模型,通過ACIP技術實現參數量的靈活調整,支持無損壓縮和量化
Model Features
動態可壓縮性
支持通過size_ratio參數即時調整模型壓縮率(0-100%),且操作可逆
無損壓縮
壓縮過程保留原始模型性能,壓縮後仍可進行推理或微調
量化支持
兼容bitsandbytes的4比特量化方案,可進一步降低內存佔用
Model Capabilities
多語言文本生成
模型壓縮
量化推理
Use Cases
資源優化
邊緣設備部署
通過壓縮和量化在資源受限設備上部署大語言模型
內存佔用減少60%以上
模型研究
壓縮率影響分析
快速測試不同壓縮率下的模型表現
無需重複訓練即可獲得壓縮性能曲線
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98