G

Google Vit Base Patch16 224 Face

由jayanta開發
基於google/vit-base-patch16-224在圖像文件夾數據集上微調的視覺Transformer模型,用於圖像分類任務。
下載量 18
發布時間 : 1/12/2023

模型概述

該模型是基於Vision Transformer (ViT)架構的圖像分類模型,經過微調後適用於特定領域的圖像識別任務。

模型特點

基於ViT架構
採用Vision Transformer架構,利用自注意力機制處理圖像數據
微調版本
在基礎模型上進行微調,適應特定圖像分類任務
中等規模模型
使用base規模的ViT模型,平衡性能和計算資源需求

模型能力

圖像分類
特徵提取
視覺模式識別

使用案例

計算機視覺
人臉圖像分類
對包含人臉的圖像進行分類識別
在評估集上達到72.49%的準確率
通用圖像分類
對各類圖像進行分類識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase