S

Samvit Large Patch16.sa1b

Developed by timm
Segment-Anything視覺Transformer(SAM ViT)圖像特徵模型,僅包含特徵提取和微調功能,未包含分割頭。
Downloads 124
Release Time : 5/18/2023

Model Overview

該模型是基於SA-1B數據集預訓練的視覺Transformer,主要用於圖像特徵提取和微調任務,權重初始化採用MAE預訓練權重。

Model Features

大尺寸分塊處理
採用16x16的大尺寸分塊策略處理1024x1024分辨率圖像
MAE預訓練初始化
權重初始化採用MAE(Masked Autoencoder)預訓練策略
高計算效率
模型計算量為1493.9 GMACs,激活值2553.8百萬,適合大規模圖像處理

Model Capabilities

圖像特徵提取
圖像分類
圖像嵌入表示

Use Cases

計算機視覺
圖像分類
可用於圖像分類任務,提取圖像特徵後進行分類
圖像檢索
通過提取圖像嵌入特徵實現相似圖像檢索
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase