SlimSAM-uniform-50開源模型 - 用剪枝蒸餾框架高效生成相似性能，超省訓練數據！

Home

Slimsam Uniform 50

Developed by Zigeng

SlimSAM是一種創新的SAM模型壓縮方法，通過剪枝-蒸餾框架高效複用預訓練SAM，僅需0.1%訓練數據即可達到相近性能。

圖像分割

Transformers

OtherOpen Source License:Apache-2.0 #輕量分割模型 #低數據依賴 #剪枝蒸餾技術

Downloads 9,459

Release Time : 1/8/2024

Model Overview

SlimSAM是一種分割萬物模型(SAM)的輕量化版本，通過創新的交替瘦身策略和剪枝-蒸餾框架，大幅減少了模型參數量和運算量，同時保持了原始SAM的分割性能。

Model Features

高效壓縮

將SAM模型參數量降至0.9%(570萬)，運算量降至0.8%(210億次)

數據高效

僅需0.1%(1萬張)訓練數據即可達到與原始SAM相近的性能

交替瘦身策略

通過創新的剪枝-蒸餾框架漸進式壓縮模型，增強知識傳承

無標籤剪枝標準

使剪枝目標與優化指標對齊，提升剪枝後的蒸餾效果

Model Capabilities

圖像分割

物體識別

視覺特徵提取

Use Cases

計算機視覺

通用圖像分割

對任意圖像中的物體進行分割

在減少99.9%參數量的情況下保持與原始SAM相近的分割精度

資源受限環境部署

在計算資源有限的設備上實現高效圖像分割

運算量降至原始SAM的0.8%

🚀 SlimSAM：0.1%數據讓任意分割模型瘦身

SlimSAM是一種新穎的SAM壓縮方法，通過高效複用預訓練的SAM模型，在無需大量重新訓練的情況下，顯著減少了模型的參數數量和計算量，同時僅需使用原模型0.1%的訓練數據，就能達到接近原模型的性能。

🚀 快速開始

模型使用

以下是本地統一剪枝的SlimSAM - 50模型的快速狀態字典加載示例：

model = SamModel.from_pretrained("Zigeng/SlimSAM-uniform-50").to("cuda")
processor = SamProcessor.from_pretrained("Zigeng/SlimSAM-uniform-50")

img_url = "https://huggingface.co/ybelkada/segment-anything/resolve/main/assets/car.png"
raw_image = Image.open(requests.get(img_url, stream=True).raw).convert("RGB")
input_points = [[[450, 600]]] # 2D localization of a window
inputs = processor(raw_image, input_points=input_points, return_tensors="pt").to("cuda")
outputs = model(**inputs)
masks = processor.image_processor.post_process_masks(outputs.pred_masks.cpu(), inputs["original_sizes"].cpu(), inputs["reshaped_input_sizes"].cpu())
scores = outputs.iou_scores

✨ 主要特性

高效複用預訓練模型

SlimSAM通過統一的剪枝 - 蒸餾框架，高效複用預訓練的SAM模型，無需大量重新訓練。

交替瘦身策略

採用創新的交替瘦身策略，將壓縮過程劃分為漸進式步驟，交替修剪和蒸餾解耦的模型結構，與以往的修剪技術不同。

無標籤剪枝準則

提出了一種新穎的無標籤剪枝準則，使剪枝目標與優化目標一致，提高剪枝後的蒸餾效果。

顯著的性能提升

與原始的SAM - H相比，SlimSAM在將參數數量減少到0.9%（570萬）、MACs減少到0.8%（21G），且僅需0.1%（1萬）的訓練數據的情況下，仍能達到接近的性能。與其他SAM壓縮方法相比，在使用少10倍以上訓練數據的情況下，實現了顯著更優的性能。

📚 詳細文檔

簡介

SlimSAM是一種新穎的SAM壓縮方法，它通過統一的剪枝 - 蒸餾框架，高效複用預訓練的SAM模型，無需大量重新訓練。為了增強從原始SAM繼承的知識，我們採用了一種創新的交替瘦身策略，將壓縮過程劃分為漸進式步驟。與以往的剪枝技術不同，我們交替修剪和蒸餾解耦的模型結構。此外，還提出了一種新穎的無標籤剪枝準則，使剪枝目標與優化目標一致，從而提高剪枝後的蒸餾效果。

SlimSAM在將參數數量減少到0.9%（570萬）、MACs減少到0.8%（21G），且僅需0.1%（1萬）的訓練數據的情況下，仍能達到接近原始SAM - H的性能。大量實驗表明，與其他SAM壓縮方法相比，我們的方法在使用少10倍以上訓練數據的情況下，實現了顯著更優的性能。

📄 許可證

本項目採用Apache - 2.0許可證。

📚 BibTex引用

如果您在研究中使用了SlimSAM，請使用以下BibTeX條目。感謝您的支持！

@misc{chen202301,
      title={0.1% Data Makes Segment Anything Slim}, 
      author={Zigeng Chen and Gongfan Fang and Xinyin Ma and Xinchao Wang},
      year={2023},
      eprint={2312.05284},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

致謝

SAM (Segment Anything) [bib]

@article{kirillov2023segany,
  title={Segment Anything}, 
  author={Kirillov, Alexander and Mintun, Eric and Ravi, Nikhila and Mao, Hanzi and Rolland, Chloe and Gustafson, Laura and Xiao, Tete and Whitehead, Spencer and Berg, Alexander C. and Lo, Wan-Yen and Doll{\'a}r, Piotr and Girshick, Ross},
  journal={arXiv:2304.02643},
  year={2023}
}

Torch Pruning (DepGraph: Towards Any Structural Pruning) [bib]

@inproceedings{fang2023depgraph,
  title={Depgraph: Towards any structural pruning},
  author={Fang, Gongfan and Ma, Xinyin and Song, Mingli and Mi, Michael Bi and Wang, Xinchao},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  pages={16091--16101},
  year={2023}
}