V

Vit Msn Base

由facebook開發
採用MSN方法預訓練的視覺Transformer模型,適用於少樣本圖像分類任務
下載量 694
發布時間 : 9/9/2022

模型概述

該模型通過Masked Siamese Networks方法預訓練,學習圖像的內在表示,特別適合標籤樣本有限的下游任務

模型特點

少樣本學習
通過MSN預訓練方法,在標籤樣本有限的情況下仍能取得良好表現
聯合嵌入架構
將掩碼圖像塊的原型與未掩碼圖像塊的原型進行匹配,學習更魯棒的表示
基於Transformer
採用視覺Transformer架構,以圖像塊序列形式處理輸入

模型能力

圖像特徵提取
少樣本圖像分類

使用案例

計算機視覺
圖像分類
在標籤數據有限的情況下進行圖像分類任務
在少樣本和極少量樣本場景下表現優異
特徵提取
作為骨幹網絡提取圖像特徵用於下游任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase