D

Dog Breeds Multiclass Image Classification With Vit

由wesleyacheng開發
使用谷歌視覺Transformer架構微調的犬種分類模型,支持120種犬類的圖像識別
下載量 584
發布時間 : 7/9/2023

模型概述

該模型基於谷歌視覺Transformer(vit-base-patch16-224-in21k)架構,在斯坦福狗狗數據集上微調訓練,專門用於120種犬類的圖像分類任務。

模型特點

先進視覺架構
採用谷歌視覺Transformer架構,通過自注意力機制實現全局圖像感知
高精度分類
在120種犬類分類任務上達到84%的Top-1準確率和97.1%的Top-3準確率
預訓練優勢
基於ImageNet-21k大規模預訓練模型微調,有效克服數據限制

模型能力

犬種圖像分類
多類別圖像識別

使用案例

寵物識別
犬種自動識別
通過上傳犬隻照片自動識別其品種
Top-1準確率84%,Top-3準確率97.1%
寵物管理
寵物檔案建立
為寵物醫院或收容所自動建立犬種檔案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase