V

Vit Base DogSick

由jungjongho開發
基於Google的ViT基礎模型微調的視覺分類模型,適用於特定領域的圖像識別任務
下載量 29
發布時間 : 10/22/2022

模型概述

該模型是基於Google的ViT-base-patch16-224-in21k模型進行微調的版本,主要用於圖像分類任務。在評估中表現出中等水平的準確率和F1分數。

模型特點

基於ViT架構
採用Vision Transformer架構,利用自注意力機制處理圖像數據
中等規模模型
基於ViT-base架構,平衡了性能和計算資源需求
微調優化
在特定領域數據集上進行微調,可能針對特定類型的圖像分類任務

模型能力

圖像分類
特徵提取

使用案例

計算機視覺
特定領域圖像分類
可用於特定領域的圖像分類任務,如醫學圖像分析、工業質檢等
在評估集上達到61%的準確率和59.8%的F1分數
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase