V

Vit Large Patch16 224.mae

Developed by timm
基於視覺變換器(ViT)的大型圖像特徵提取模型,採用自監督掩碼自編碼器(MAE)方法在ImageNet-1k數據集上預訓練
Downloads 960
Release Time : 5/9/2023

Model Overview

該模型是一個視覺變換器架構的大型圖像特徵提取模型,主要用於圖像分類和特徵提取任務。通過掩碼自編碼器(MAE)的自監督學習方法在ImageNet-1k數據集上進行預訓練。

Model Features

自監督預訓練
採用掩碼自編碼器(MAE)方法進行自監督預訓練,無需大量標註數據即可學習有效特徵表示
大規模視覺變換器
基於ViT-Large架構,具有303.3M參數,能夠捕捉豐富的視覺特徵
高效特徵提取
支持提取圖像全局特徵或局部patch特徵,適用於多種下游視覺任務

Model Capabilities

圖像分類
圖像特徵提取
視覺表示學習

Use Cases

計算機視覺
圖像分類
可用於對圖像進行分類,支持1000類ImageNet分類任務
特徵提取
可作為特徵提取器用於下游視覺任務,如目標檢測、圖像分割等
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase