D

Dog Food Vit Base Patch16 224 In21k

由sasha開發
這是一個基於Vision Transformer (ViT)架構的圖像分類模型,專門用於區分狗和食物的圖像。
下載量 32
發布時間 : 6/20/2022

模型概述

該模型在狗與食物數據集上訓練,能夠高準確率地區分狗和食物的圖像。適用於需要自動分類這兩種圖像的應用場景。

模型特點

高準確率
在測試集上達到99.78%的準確率,表現優異。
基於ViT架構
採用Vision Transformer架構,利用patch16-224-in21k預訓練模型。
簡單易用
可通過HuggingPics輕鬆訓練和使用。

模型能力

圖像分類
區分狗和食物

使用案例

圖像分類
寵物與食物識別
自動識別圖片中是狗還是食物
準確率高達99.78%
內容過濾
用於過濾或分類包含狗或食物的內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase