dog-food-vit-base-patch16-224-in21k開源圖像分類模型

Dog Food Vit Base Patch16 224 In21k

由sasha開發

這是一個基於Vision Transformer (ViT)架構的圖像分類模型，專門用於區分狗和食物的圖像。

下載量 32

發布時間 : 6/20/2022

模型概述

該模型在狗與食物數據集上訓練，能夠高準確率地區分狗和食物的圖像。適用於需要自動分類這兩種圖像的應用場景。

高準確率

在測試集上達到99.78%的準確率，表現優異。

基於ViT架構

採用Vision Transformer架構，利用patch16-224-in21k預訓練模型。

簡單易用

可通過HuggingPics輕鬆訓練和使用。

圖像分類

區分狗和食物

圖像分類

寵物與食物識別

自動識別圖片中是狗還是食物

準確率高達99.78%

內容過濾

用於過濾或分類包含狗或食物的內容

屬性	詳情
標籤	image-classification、pytorch、huggingpics
數據集	sasha/dog-food
評估指標	accuracy、f1