# ImageNet預訓練

Mar Vae Kl16
MIT
這是一個基於ImageNet-1k數據集訓練的KL16變分自編碼器(VAE)模型,用於圖像到圖像的轉換任務。
圖像生成
M
xwen99
81
0
Dinov2 Small Imagenet1k 1 Layer
Apache-2.0
基於DINOv2方法訓練的小型視覺Transformer模型,適用於圖像特徵提取和分類任務
圖像分類 Transformers
D
facebook
50.86k
2
Pvt Tiny 224
Apache-2.0
金字塔視覺變換器(PVT)是一種基於變換器架構的視覺模型,專為圖像分類任務設計。
圖像分類 Transformers
P
Xrenya
25
0
Efficientnet B6
Apache-2.0
EfficientNet是一款移動端友好的純卷積模型,通過複合係數統一縮放深度/寬度/分辨率維度,在ImageNet-1k數據集上訓練
圖像分類 Transformers
E
google
167
0
Efficientnet B5
Apache-2.0
EfficientNet是一種對移動設備友好的純卷積模型,通過複合係數統一縮放深度/寬度/分辨率維度,在ImageNet-1k數據集上訓練。
圖像分類 Transformers
E
google
331
1
Efficientnet B4
Apache-2.0
EfficientNet是一款移動端友好的純卷積模型,通過複合係數統一調整深度、寬度和分辨率維度,在ImageNet-1k數據集上訓練而成。
圖像分類 Transformers
E
google
5,528
1
Efficientnet B3
Apache-2.0
EfficientNet是一款移動端友好的純卷積神經網絡,通過複合係數統一調整深度/寬度/分辨率維度,實現高效縮放
圖像分類 Transformers
E
google
418
2
Efficientnet B2
Apache-2.0
EfficientNet是一種移動端友好的純卷積模型,通過複合係數統一縮放深度/寬度/分辨率維度,在圖像分類任務中表現優異。
圖像分類 Transformers
E
google
276.94k
2
Efficientnet B1
Apache-2.0
EfficientNet是一款移動端友好的純卷積神經網絡,通過複合係數統一調整深度/寬度/分辨率維度,實現高效縮放。
圖像分類 Transformers
E
google
1,868
1
Efficientnet B0
Apache-2.0
EfficientNet是一款移動端友好的純卷積模型,通過複合係數統一縮放深度/寬度/分辨率維度,在ImageNet-1k數據集上訓練。
圖像分類 Transformers
E
google
17.12k
12
Efficientformer L3 300
Apache-2.0
EfficientFormer-L3是由Snap Research開發的輕量級視覺Transformer模型,專為移動設備優化,在保持高性能的同時實現低延遲。
圖像分類 英語
E
snap-research
279
2
Convnextv2 Base.fcmae
基於ConvNeXt-V2的自監督特徵表示模型,採用全卷積掩碼自編碼器框架(FCMAE)進行預訓練
圖像分類 Transformers
C
timm
629
1
Vit Base Patch8 224.dino
Apache-2.0
基於自監督DINO方法訓練的視覺Transformer(ViT)圖像特徵模型,適用於圖像分類和特徵提取任務。
圖像分類 Transformers
V
timm
9,287
1
Nat Mini In1k 224
MIT
NAT-Mini 是基於鄰域注意力機制的輕量級視覺Transformer模型,專為ImageNet圖像分類任務設計
圖像分類 Transformers 其他
N
shi-labs
109
0
Mobilenet V2 0.35 96
其他
MobileNet V2是一種小型、低延遲、低功耗的視覺模型,專為移動設備優化設計
圖像分類 Transformers
M
google
540
1
Mobilenet V2 1.4 224
其他
MobileNet V2是一種輕量級的卷積神經網絡,專為移動設備設計,在圖像分類任務中表現出色。
圖像分類 Transformers
M
Matthijs
26
0
Mobilenet V2 1.0 224
其他
MobileNet V2是一種輕量級卷積神經網絡,專為移動設備設計,在圖像分類任務中表現優異。
圖像分類 Transformers
M
Matthijs
29
0
Mobilenet V1 1.0 224
其他
MobileNet V1是一種輕量級卷積神經網絡,專為移動和嵌入式視覺應用設計,在ImageNet-1k數據集上預訓練。
圖像分類 Transformers
M
Matthijs
41
0
Levit 128S
Apache-2.0
LeViT-128S是基於ImageNet-1k數據集預訓練的視覺Transformer模型,結合了卷積網絡的優勢以實現更快推理。
圖像分類 Transformers
L
facebook
3,198
4
Levit 128
Apache-2.0
LeViT-128是一個基於視覺Transformer架構的圖像分類模型,通過結合卷積網絡的優勢實現高效推理。
圖像分類 Transformers
L
facebook
44
0
Levit 256
Apache-2.0
LeViT-256是基於Transformer架構的高效視覺模型,專為快速推理設計,在ImageNet-1k數據集上預訓練。
圖像分類 Transformers
L
facebook
37
0
Levit 384
Apache-2.0
LeViT-384是基於ImageNet-1k數據集預訓練的視覺Transformer模型,結合了卷積網絡的優勢以實現更快的推理速度。
圖像分類 Transformers
L
facebook
37
0
Mobilevit Small
其他
MobileViT是一種輕量級、低延遲的視覺Transformer模型,結合了CNN和Transformer的優勢,適用於移動端設備。
圖像分類 Transformers
M
apple
894.23k
65
Mobilevit Small
其他
MobileViT是一種輕量級、低延遲的視覺Transformer模型,結合了CNN和Transformer的優勢,適用於移動端設備。
圖像分類 Transformers
M
Matthijs
39
0
Data2vec Vision Large
Apache-2.0
Data2Vec-Vision是基於BEiT架構的自監督學習模型,在ImageNet-1k數據集上預訓練,適用於圖像分類任務。
圖像分類 Transformers
D
facebook
225
2
Data2vec Vision Base
Apache-2.0
Data2Vec-Vision是基於BEiT架構的自監督學習模型,在ImageNet-1k數據集上預訓練,適用於圖像分類任務。
圖像分類 Transformers
D
facebook
427
3
Cvt 21
Apache-2.0
CvT-21是基於ImageNet-1k數據集預訓練的視覺變換器模型,通過引入卷積操作改進傳統視覺變換器。
圖像分類 Transformers
C
microsoft
589
0
Cvt 21 384
Apache-2.0
CvT-21是基於卷積視覺變換器架構的圖像分類模型,在ImageNet-1k數據集上以384x384分辨率預訓練。
圖像分類 Transformers
C
microsoft
29
1
Cvt 13 384
Apache-2.0
CvT-13是基於ImageNet-1k數據集預訓練的視覺變換器模型,通過引入卷積操作改進了傳統視覺變換器的性能。
圖像分類 Transformers
C
microsoft
27
0
Regnet Y 320
Apache-2.0
基於imagenet-1k訓練的RegNet圖像分類模型,通過神經架構搜索設計的高效網絡結構
圖像分類 Transformers
R
facebook
29
0
Regnet Y 160
Apache-2.0
基於imagenet-1k數據集訓練的RegNet模型,通過神經架構搜索設計的高效視覺模型
圖像分類 Transformers
R
facebook
18
0
Regnet Y 080
Apache-2.0
基於ImageNet-1k訓練的RegNet圖像分類模型,採用神經架構搜索技術設計
圖像分類 Transformers
R
facebook
30
0
Regnet Y 064
Apache-2.0
基於imagenet-1k訓練的RegNet模型,通過神經架構搜索設計的高效視覺模型
圖像分類 Transformers
R
facebook
17
0
Regnet Y 040
Apache-2.0
基於imagenet-1k訓練的RegNet模型,通過神經架構搜索設計的高效視覺模型
圖像分類
R
facebook
2,083
1
Regnet Y 032
Apache-2.0
基於imagenet-1k訓練的RegNet圖像分類模型,通過神經架構搜索設計的高效網絡結構
圖像分類 Transformers
R
facebook
21
0
Regnet Y 016
Apache-2.0
基於ImageNet-1k訓練的RegNet模型,通過神經架構搜索設計的高效視覺模型
圖像分類 Transformers
R
facebook
19
0
Regnet Y 008
Apache-2.0
基於ImageNet-1k訓練的RegNet模型,通過神經架構搜索設計的高效視覺模型
圖像分類 Transformers
R
facebook
22
0
Regnet Y 006
Apache-2.0
RegNet是一種通過神經架構搜索設計的圖像分類模型,在imagenet-1k數據集上訓練。
圖像分類 Transformers
R
facebook
18
0
Regnet Y 004
Apache-2.0
RegNet是基於imagenet-1k訓練的視覺分類模型,通過神經架構搜索(NAS)設計的高效網絡結構
圖像分類 Transformers
R
facebook
17
0
Regnet X 320
Apache-2.0
基於imagenet-1k訓練的RegNet模型,通過神經架構搜索設計的高效視覺模型
圖像分類 Transformers
R
facebook
31
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase