V

Vit Msn Large 7

由facebook開發
該視覺Transformer模型採用MSN方法預訓練,在少樣本場景下表現出色,適用於圖像分類等任務
下載量 67
發布時間 : 9/9/2022

模型概述

基於掩碼孿生網絡(MSN)預訓練的視覺Transformer模型,通過匹配掩碼與未掩碼圖像塊的原型學習圖像表徵,特別適合標註數據有限的場景

模型特點

少樣本學習能力
採用MSN預訓練方法,在標註數據有限的情況下仍能保持優異性能
聯合嵌入架構
通過匹配掩碼塊與未掩碼塊的原型學習圖像表徵
大規模預訓練
基於ImageNet-1k數據集進行預訓練,學習通用視覺特徵

模型能力

圖像特徵提取
圖像分類
少樣本學習

使用案例

計算機視覺
圖像分類
在標註數據有限的情況下進行圖像分類任務
在少樣本和極少量樣本場景下表現卓越
特徵提取
作為骨幹網絡提取圖像特徵用於下游任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase