V

Vit Base Patch16 224 Wi2

由Imene開發
基於google/vit-base-patch16-224微調的視覺Transformer模型,適用於圖像分類任務
下載量 21
發布時間 : 9/10/2022

模型概述

該模型是基於Vision Transformer (ViT)架構的圖像分類模型,通過微調提升了在特定數據集上的表現。

模型特點

基於ViT架構
採用Vision Transformer架構,使用自注意力機制處理圖像
混合精度訓練
使用mixed_float16精度進行訓練,優化計算效率
AdamW優化器
採用AdamWeightDecay優化器配合多項式學習率衰減策略

模型能力

圖像分類
特徵提取

使用案例

計算機視覺
通用圖像分類
對輸入圖像進行分類預測
在驗證集上達到24.91%的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase