V

Vit Msn Large

由facebook開發
採用MSN方法預訓練的視覺Transformer模型,在少樣本場景下表現優異
下載量 48
發布時間 : 9/9/2022

模型概述

該視覺Transformer模型通過Masked Siamese Networks方法預訓練,特別適合標註數據有限的圖像分類任務,能夠學習圖像的內在表徵並遷移到下游任務

模型特點

少樣本學習能力
通過MSN預訓練方法,在標註數據有限的場景下仍能保持優異性能
聯合嵌入架構
採用掩碼圖塊與原型圖塊匹配的獨特訓練方式
遷移學習友好
預訓練表徵可輕鬆遷移到各種下游視覺任務

模型能力

圖像特徵提取
少樣本圖像分類
視覺表徵學習

使用案例

計算機視覺
少樣本圖像分類
在標註樣本有限的情況下實現圖像分類
在少樣本和極少量樣本場景下表現卓越
視覺特徵提取
作為基礎編碼器提取圖像特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase