S

Stanford Car Vit Patch16

由therealcyberlord開發
這是一個基於Vision Transformer (ViT)架構的圖像分類模型,專門針對斯坦福汽車數據集進行了微調,用於精細分類196類汽車型號。
下載量 665
發布時間 : 8/8/2022

模型概述

該模型基於谷歌的ViT-base-patch16-224架構,在斯坦福汽車數據集上微調,用於識別和分類196種不同品牌、型號和年份的汽車。

模型特點

精細分類能力
能夠識別196種不同品牌、型號和年份的汽車,分類粒度精細
基於ViT架構
使用Vision Transformer架構,具有強大的圖像特徵提取能力
高準確率
在測試集上達到約86%的準確率

模型能力

汽車圖像分類
精細類別識別
品牌型號年份識別

使用案例

汽車行業
二手車識別系統
自動識別和分類二手車的品牌、型號和年份
提高二手車評估效率
汽車銷售平臺
為汽車銷售網站提供自動圖片分類功能
改善用戶體驗和搜索效率
安防監控
停車場管理系統
自動識別進出車輛的型號信息
增強停車場安全管理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase