# 高精度圖像分類

PE Core G14 448
Apache-2.0
感知編碼器(PE)是通過簡單視覺-語言學習訓練出的最先進的圖像與視頻理解編碼器,在多種視覺任務上均達到最先進性能。
文本生成圖像
P
facebook
22.83k
14
Mambavision L3 256 21K
其他
首個結合Mamba與Transformer優勢的計算機視覺混合模型,通過重構Mamba公式增強視覺特徵建模效率,在Mamba架構最後幾層引入自注意力模塊提升長程空間依賴建模能力。
圖像分類 Transformers
M
nvidia
510
7
Mambavision B 21K
其他
首個融合曼巴(Mamba)與Transformer優勢的計算機視覺混合模型,通過重構曼巴公式增強視覺特徵建模效率,並在曼巴架構末端引入自注意力模塊提升長程空間依賴建模能力。
圖像分類 Transformers
M
nvidia
1,395
4
Centraasia ResNet 50
MIT
基於ResNet-50架構的預訓練模型,專門針對中亞食物圖像分類任務進行微調,支持34種中亞食物分類。
圖像分類 Transformers 英語
C
Eraly-ml
86
1
Smart Tv Hand Gestures Image Detection
Apache-2.0
基於Vision Transformer架構的智能電視手勢識別模型,能夠準確分類9種常見手勢。
圖像分類 Transformers
S
dima806
65
1
Vit Base Beans
Apache-2.0
基於Google Vision Transformer (ViT)架構的圖像分類模型,專門針對beans數據集進行微調
圖像分類 Transformers
V
HieuVo
49
1
Ai Image Detector Dev Deploy
這是一個基於自動訓練的圖像分類模型,能夠識別多種常見物體類別
圖像分類 TensorBoard
A
haywoodsloan
59
1
Cat Dog Classifier With Small Datasest
Apache-2.0
基於microsoft/resnet-50微調的貓狗圖像分類模型,在評估集上準確率達95%
圖像分類 Transformers
C
MoGHenry
33
1
Cat Dog Classifier
Apache-2.0
基於ResNet-50架構微調的圖像分類模型,專門用於區分貓和狗的圖像,準確率達96.88%。
圖像分類 Transformers
C
MoGHenry
58
1
Tomato Leaf Disease Classification Resnet50
Apache-2.0
基於ResNet-50微調的番茄葉病圖像分類模型,準確率達99.56%
圖像分類 Transformers
T
wellCh4n
109
1
Tomato Leaf Disease Classification Vit
Apache-2.0
基於Google Vision Transformer (ViT)架構微調的番茄葉片病害分類模型,在評估集上準確率達99.67%
圖像分類 Transformers
T
wellCh4n
55
1
Ai Image Detector Deploy
這是一個基於AutoTrain訓練的AI圖像分類模型,能夠準確識別和分類多種圖像內容。
圖像分類 Transformers
A
haywoodsloan
6,077
4
Aimv2 3B Patch14 448
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多個視覺理解基準測試中表現優異。
圖像分類
A
apple
161
12
Aimv2 1B Patch14 448
AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列,在多個視覺理解基準測試中表現優異。
圖像分類
A
apple
71
0
Aimv2 Huge Patch14 448
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多個基準測試中表現優異。
圖像分類
A
apple
1,672
3
Aimv2 Large Patch14 448
AIMv2是基於多模態自迴歸目標預訓練的視覺模型系列,在多個基準測試中表現優異
圖像分類
A
apple
2,210
5
Aimv2 3B Patch14 336
AIMv2 是一個通過多模態自迴歸目標預訓練的視覺模型系列,在多個多模態理解基準測試中表現優異。
圖像分類
A
apple
23
2
Aimv2 1B Patch14 336
AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列,在多項多模態理解基準測試中表現優異。
圖像分類
A
apple
52
0
Aimv2 Huge Patch14 336
AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列,在多個視覺理解基準測試中表現優異。
圖像分類
A
apple
188
0
Aimv2 Large Patch14 336
AIMv2是基於多模態自迴歸目標預訓練的視覺模型系列,在多項視覺任務中表現優異。
圖像分類
A
apple
6,177
3
Aimv2 3B Patch14 224
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多項基準測試中表現優異
圖像分類
A
apple
57
3
Aimv2 1B Patch14 224
AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列,在多項視覺任務中表現優異。
圖像分類
A
apple
299
7
Aimv2 Huge Patch14 224
AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列,在多項基準測試中表現優異。
圖像分類
A
apple
54
9
Aimv2 Large Patch14 224
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多項視覺任務中表現優異。
圖像分類
A
apple
759
50
Vit Batik
MIT
這是一個基於Vision Transformer (ViT)和BEiT架構的圖像分類模型,專門用於識別印度尼西亞蠟染圖案。
圖像分類 其他
V
dewanakl
60
1
Mambavision L 1K
其他
首個結合Mamba與Transformer優勢的計算機視覺混合模型,通過重新設計Mamba公式增強視覺特徵建模能力
圖像分類 Transformers
M
nvidia
1,542
5
UL Base Classification
Apache-2.0
該模型是基於Google的ViT-base-patch16-224在圖像文件夾數據集上微調的圖像分類模型,驗證集準確率達89.21%。
圖像分類 Transformers
U
sharmajai901
2,432
1
AI VS REAL IMAGE DETECTION
Apache-2.0
基於Google Vision Transformer (ViT)架構微調的圖像分類模型,用於區分AI生成圖像與真實圖像
圖像分類 Transformers
A
Hemg
259
2
Cat Vs Dog Classification
Apache-2.0
基於Google的ViT模型在cats_vs_dogs數據集上微調的圖像分類模型,用於區分貓和狗的圖像。
圖像分類 Transformers
C
kazuma313
42
1
Carmodel
Apache-2.0
基於google/vit-base-patch16-224微調的視覺模型,在評估集上F1分數達到0.9931
圖像分類 Transformers
C
TechRoC123
24
1
Vitforimageclassification
Apache-2.0
該模型是基於google/vit-base-patch16-224-in21k在CIFAR10數據集上微調的圖像分類模型,準確率達96.78%。
圖像分類 Transformers
V
Andron00e
43
2
Vit Finetuned Vanilla Cifar10 0
Apache-2.0
基於Vision Transformer (ViT)架構在CIFAR-10數據集上微調的圖像分類模型,準確率達99.2%
圖像分類 Transformers
V
02shanky
68
1
Vit Base Patch16 224 In21k Finetuned Moderation
Apache-2.0
基於Google Vision Transformer架構的圖像分類模型,專為內容審核任務微調,在測試集上達到90.43%準確率
圖像分類 Transformers
V
mbehbooei
752
3
Dogs Breed Classification Using Vision Transformers
Openrail
這是一個用於圖像分類任務的模型,支持英文語言,採用開放許可。
圖像分類 Transformers 英語
D
AmitMidday
27
1
Swin Tiny Patch4 Window7 224 Cifar10
Apache-2.0
基於Swin Transformer架構的微小模型,專為CIFAR-10圖像分類任務微調
圖像分類 Transformers
S
Skafu
94
1
Clasificacion Vit Model Manuel Chaves
Apache-2.0
基於google/vit-base-patch16-224-in21k微調的圖像分類模型,在豆類數據集上達到97.74%的準確率
圖像分類 Transformers
C
machves
15
0
Deit Tiny Patch16 224 Finetuned Main Gpu 20e Final
Apache-2.0
基於DeiT-tiny架構的輕量級圖像分類模型,在自定義圖像數據集上微調後達到98.56%的驗證準確率
圖像分類 Transformers
D
Gokulapriyan
15
0
Vitezoa
這是一個由HuggingPics生成的圖像分類模型,能夠對多種圖像進行分類,如動物、鳥類和國旗等。
圖像分類 Transformers
V
ezoa
15
0
Swinv2 Chaoyang
Apache-2.0
這是一個基於ImageNet-1k數據集訓練的視覺圖像分類模型,能夠識別多種常見物體和場景。
圖像分類 Transformers
S
Snarci
14
0
Clip Vit Large Patch14 Finetuned Fruits 360 Vitlarge
基於CLIP ViT-Large模型在Fruits-360數據集上微調的高精度水果圖像分類模型
圖像分類 Transformers
C
AnneMarie1
29
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase