Vision Perceiver Learned
Apache-2.0
基於ImageNet預訓練的通用視覺感知器模型,採用學習型位置嵌入處理圖像輸入
圖像分類
Transformers

V
deepmind
1,894
13
Medai Resnet50 Brain
MIT
ResNet-50 是一個深度殘差網絡,由微軟研究院開發,廣泛用於圖像分類任務。
圖像分類
M
aryan-anand
31
1
Cat Dog Root Me
一個基於PyTorch和HuggingPics構建的圖像分類模型,能夠準確區分貓和狗的圖片。
圖像分類
TensorBoard

C
danihdms
21
1
Light Gender Classifier
一個基於HuggingPics生成的輕量級圖像分類模型,用於性別分類任務。
圖像分類
TensorBoard

L
musaoc
21
1
Plant Identification Vit
Apache-2.0
基於Google Vision Transformer (ViT)架構微調的植物識別模型,在評估集上達到80.96%的準確率
圖像分類
Transformers

P
marwaALzaabi
37
1
Utkface Race Classifications
Apache-2.0
該模型是基於microsoft/resnet-50在未知數據集上微調的版本,主要用於圖像分類任務,在評估集上取得了84.86%的準確率。
圖像分類
Transformers

U
raffaelsiregar
202
1
Kat Tiny Patch16 224.vitft
Apache-2.0
KAT是一種採用分組有理科爾莫戈羅夫-阿諾德網絡(GR-KAN)替代傳統Transformer中通道混合器的新型視覺模型,在ImageNet-1k數據集上訓練。
圖像分類
K
adamdad
293
1
Negclip
MIT
開放剪輯是一個零樣本圖像分類模型,能夠在不進行微調的情況下對圖像進行分類。
圖像分類
N
Nano1337
92
0
UL Exterior Classification
Apache-2.0
基於Google的ViT-base-patch16-224模型微調而成的圖像分類模型,在評估集上準確率為68.97%
圖像分類
Transformers

U
sharmajai901
319
1
Plant Disease Detection Project
其他
MobileNet V2是一種輕量級的卷積神經網絡,專為移動設備設計,在延遲、模型大小和準確性之間取得平衡。
圖像分類
Transformers

P
Diginsa
242.43k
4
Font Identifier
Apache-2.0
基於ResNet-18微調的字體識別模型,在測試集上準確率達78.1%
圖像分類
Transformers

F
ariadnak
44
2
Font Identifier
MIT
基於ResNet18微調的字體識別模型,可識別48種標準字體,測試準確率達96.33%
圖像分類
Transformers 英語

F
gaborcselle
1,292
17
Vit Base Patch16 224 In21k Face Recognition
Apache-2.0
本模型是基於Google的ViT架構在圖像文件夾數據集上微調的人臉識別模型,在評估集上取得了接近完美的準確率。
人臉相關
Transformers

V
jayanta
216
12
Birds Classifier EfficientNetB2
Apache-2.0
基於EfficientNet-B2微調的鳥類圖像分類器,可識別525種鳥類,準確率高達99%
圖像分類
Transformers

B
dennisjooo
4,320
20
Resnet18 Catdog Classifier
Apache-2.0
基於ResNet-18微調的貓狗圖像分類模型,在Kaggle貓狗數據集上訓練,準確率達99.29%
圖像分類
Transformers 英語

R
hilmansw
216
1
Dinov2 Small Imagenet1k 1 Layer
Apache-2.0
基於DINOv2方法訓練的小型視覺Transformer模型,適用於圖像特徵提取和分類任務
圖像分類
Transformers

D
facebook
50.86k
2
Organoids Prova Organoid
Apache-2.0
該模型是基於Google的ViT-base-patch16-224在圖像文件夾數據集上微調的圖像分類模型,在評估集上取得了85.76%的準確率。
圖像分類
Transformers

O
gcicceri
25
1
Cola001
基於HuggingPics生成的圖像分類模型,能夠識別不同品種的狗
圖像分類
Transformers

C
GiaKhanh
29
0
Pvt Tiny 224
Apache-2.0
金字塔視覺變換器(PVT)是一種基於變換器架構的視覺模型,專為圖像分類任務設計。
圖像分類
Transformers

P
Xrenya
25
0
Fun
Apache-2.0
基於google/vit-base-patch16-224微調的視覺模型,適用於圖像分類任務
圖像分類
Transformers

F
tcvrishank
16
0
Vit Bach Demo
Apache-2.0
基於google/vit-base-patch16-224微調的視覺Transformer模型,適用於圖像分類任務
圖像分類
Transformers

V
tcvrishank
16
0
Vit Base Letter
Apache-2.0
基於Google的ViT基礎模型在字母識別數據集上微調的圖像分類模型,準確率達98.81%
圖像分類
Transformers 英語

V
pittawat
93
2
Vit Diatome
Apache-2.0
基於Google的ViT模型在Diatome數據集上微調的視覺分類模型,準確率達94.29%
圖像分類
Transformers

V
sgonzalezsilot
38
1
Vit Base Aiornot
Apache-2.0
基於google/vit-base-patch16-224微調的視覺模型,具體用途未明確說明
圖像分類
Transformers

V
ThankGod
39
0
Face Discriminator
Apache-2.0
基於微軟ResNet-50微調的人臉分類模型,在驗證集上達到99.84%的準確率
圖像分類
Transformers

F
petrznel
23
0
Microsoft Swin Tiny Patch4 Window7 224 Ov
這是由microsoft/swin-tiny-patch4-window7-224模型轉換而來的OpenVINO版本,用於加速圖像分類推理。
圖像分類
Transformers 英語

M
helenai
508
1
Doge
Doge 是一個基於 HuggingPics 生成的圖像分類模型,專門用於識別 Doge 相關的圖像。
圖像分類
Transformers

D
Johnnyboiiii
16
0
Swin Tiny Patch4 Window7 224 Isl Finetuned
Apache-2.0
基於microsoft/swin-tiny-patch4-window7-224微調的視覺模型,在評估集上達到100%準確率
圖像分類
Transformers

S
hazardous
17
0
Fl Image Category Multi Label
Apache-2.0
這是一個基於Google的ViT模型進行微調的圖像分類模型,在fl_image_category_ds數據集上訓練,準確率達到66.22%。
圖像分類
Transformers

F
StephenSKelley
17
1
Vit Artworkclassifier
Apache-2.0
基於ViT架構的藝術風格分類模型,可識別輸入圖像的藝術風格類別
圖像分類
Transformers

V
oschamp
41
2
Fl Image Category
Apache-2.0
基於microsoft/resnet-18微調的圖像分類模型,在fl_image_category_ds數據集上訓練
圖像分類
Transformers

F
StephenSKelley
29
0
Vit Model
基於預處理1024配置數據集微調的ViT模型,用於圖像分類任務
圖像分類
Transformers

V
mm-ai
19
0
Hq Fer2013
Apache-2.0
基於Google的ViT模型微調的面部表情識別模型,在FER2013數據集上訓練,準確率達70.22%。
圖像分類
Transformers

H
Piro17
38
0
Vit Base Patch16 224 Finetuned Algae Wirs
Apache-2.0
該模型是基於Google的ViT模型在藻類數據集上微調的視覺分類模型,主要用於藻類圖像分類任務。
圖像分類
Transformers

V
samitizerxu
20
0
Resnet 50 4 32
Apache-2.0
基於microsoft/resnet-50微調的圖像分類模型,在評估集上準確率達到64.1%
圖像分類
Transformers

R
Celal11
26
0
Poke Model
Gpl-3.0
基於google/vit-base-patch16-224微調的視覺分類模型,用於識別第一世代寶可夢
圖像分類
Transformers

P
torresflo
23
1
Bald Or Not
一個基於PyTorch和HuggingPics的簡單圖像分類模型,用於判斷圖像中的人物是否禿頭。
圖像分類
Transformers

B
mvaloatto
28
3
Yolo V8 Fog Or Smog Classification
基於YOLOv8的圖像分類模型,用於識別霧和煙霧場景。
圖像分類
TensorBoard

Y
uisikdag
23
0
Genderage2
Apache-2.0
基於ViT架構的視覺Transformer模型,用於性別和年齡分類任務
圖像分類
Transformers

G
ivensamdh
263
3
Beit Base Patch16 224 Pt22k Ft22k Finetuned FER2013 7e 05 Finetuned SFEW 7e 05
Apache-2.0
基於BEiT架構的圖像分類模型,在FER2013數據集上微調,用於面部表情識別
圖像分類
Transformers

B
lixiqi
18
0
- 1
- 2
- 3
- 4
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98