V

Vit Msn Large

Developed by facebook
採用MSN方法預訓練的視覺Transformer模型,在少樣本場景下表現優異
Downloads 48
Release Time : 9/9/2022

Model Overview

該視覺Transformer模型通過Masked Siamese Networks方法預訓練,特別適合標註數據有限的圖像分類任務,能夠學習圖像的內在表徵並遷移到下游任務

Model Features

少樣本學習能力
通過MSN預訓練方法,在標註數據有限的場景下仍能保持優異性能
聯合嵌入架構
採用掩碼圖塊與原型圖塊匹配的獨特訓練方式
遷移學習友好
預訓練表徵可輕鬆遷移到各種下游視覺任務

Model Capabilities

圖像特徵提取
少樣本圖像分類
視覺表徵學習

Use Cases

計算機視覺
少樣本圖像分類
在標註樣本有限的情況下實現圖像分類
在少樣本和極少量樣本場景下表現卓越
視覺特徵提取
作為基礎編碼器提取圖像特徵
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase