vit-base-DogSick開源視覺分類模型 - 免費部署助力特定領域圖像識別

Vit Base DogSick

由jungjongho開發

基於Google的ViT基礎模型微調的視覺分類模型，適用於特定領域的圖像識別任務

下載量 29

發布時間 : 10/22/2022

模型概述

該模型是基於Google的ViT-base-patch16-224-in21k模型進行微調的版本，主要用於圖像分類任務。在評估中表現出中等水平的準確率和F1分數。

基於ViT架構

採用Vision Transformer架構，利用自注意力機制處理圖像數據

中等規模模型

基於ViT-base架構，平衡了性能和計算資源需求

微調優化

在特定領域數據集上進行微調，可能針對特定類型的圖像分類任務

圖像分類

特徵提取

計算機視覺

特定領域圖像分類

可用於特定領域的圖像分類任務，如醫學圖像分析、工業質檢等

在評估集上達到61%的準確率和59.8%的F1分數