V

Vit Msn Base 4

由facebook開發
該視覺Transformer模型採用MSN方法預訓練,在少樣本場景下表現優異,適用於圖像分類等任務
下載量 62
發布時間 : 9/9/2022

模型概述

基於MSN(Masked Siamese Networks)方法預訓練的視覺Transformer模型,通過掩碼塊與原型匹配學習圖像表示,特別適合標註數據有限的下游任務

模型特點

少樣本學習優勢
採用MSN預訓練方法,在標註數據有限的場景下仍能保持優異性能
聯合嵌入架構
通過掩碼塊與未掩碼原型的匹配學習圖像表示
分塊處理
將圖像分割為4x4的塊序列進行處理,適合處理局部圖像特徵

模型能力

圖像特徵提取
圖像分類
少樣本學習

使用案例

計算機視覺
圖像分類
在有限標註數據下實現高精度圖像分類
在少樣本和極低樣本場景下表現優異
特徵提取
提取圖像特徵用於下游任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase