S

Sam Hq Vit Huge

由syscv-community開發
SAM-HQ是Segment Anything Model(SAM)的增強版本,能夠生成更高質量的物體掩碼,特別適合處理複雜結構的物體。
下載量 516
發布時間 : 5/5/2025

模型概述

SAM-HQ通過引入高質量輸出令牌和全局-局部特徵融合技術,顯著提升了分割掩碼的質量,同時保持了原版SAM的可提示設計、效率和零樣本泛化能力。

模型特點

高質量輸出令牌
專門設計的可學習令牌,注入到掩碼解碼器中,負責預測更精確的分割掩碼。
全局-局部特徵融合
將掩碼解碼器特徵與早期和最終的ViT特徵融合,結合高級語義和低級邊界信息,改善掩碼細節。
高效改進
僅增加不到0.5%的參數,訓練時間僅需8個GPU上的4小時,即可顯著提升分割質量。
零樣本泛化
保持原版SAM的零樣本泛化能力,可在未見過的數據上直接應用。

模型能力

高質量圖像分割
基於提示的分割(點、框等)
自動掩碼生成
零樣本遷移學習

使用案例

圖像編輯
精確物體提取
從複雜背景中精確分割物體,保留細節和薄結構
相比原版SAM,能更好地保留物體邊界細節
自動化標註
高質量數據標註
自動生成精確的物體掩碼用於訓練數據標註
減少人工標註工作量,提高標註質量
醫學圖像分析
醫學結構分割
分割醫學圖像中的精細結構
適用於需要高精度分割的醫學應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase