V

Vit Msn Small

由facebook開發
該視覺Transformer模型採用MSN方法進行預訓練,適用於少樣本學習場景,特別適合圖像分類任務。
下載量 3,755
發布時間 : 9/9/2022

模型概述

該模型是一種基於Transformer架構的視覺模型,通過MSN(Masked Siamese Networks)方法進行預訓練,能夠有效學習圖像的內在表徵,適用於少樣本和極少量樣本場景下的圖像分類等任務。

模型特點

少樣本學習
通過MSN預訓練方法,模型在少樣本和極少量樣本場景下表現出卓越性能。
聯合嵌入架構
採用掩碼圖塊的原型與未掩碼圖塊進行匹配的聯合嵌入架構,有效學習圖像表徵。
預訓練優勢
預訓練後的模型可以提取適用於下游任務的特徵,如添加線性層進行圖像分類。

模型能力

圖像分類
特徵提取

使用案例

計算機視覺
少樣本圖像分類
在標註樣本較少的圖像分類任務中,使用該模型進行高效訓練和預測。
在少樣本場景下表現出卓越性能。
圖像特徵提取
使用該模型提取圖像特徵,用於後續的機器學習任務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase