# ImageNet優化

Hiera Base 224 In1k Hf
Hiera是一種分層式視覺Transformer模型,兼具快速、強大且簡潔的特點,在廣泛圖像與視頻任務中超越現有技術水平的同時顯著提升了運行速度。
圖像分類 Transformers 英語
H
facebook
188
2
Tecoa2 Clip
MIT
基於OpenAI CLIP初始化的視覺語言模型,在ImageNet上進行監督式對抗微調,具有魯棒性增強特性
文本生成圖像
T
chs20
53
1
Fare2 Clip
MIT
基於OpenAI CLIP初始化的視覺語言模型,通過無監督對抗微調提升魯棒性
文本生成圖像
F
chs20
543
2
Fare4 Clip
MIT
基於OpenAI CLIP初始化的視覺語言模型,通過無監督對抗微調提升魯棒性
文本生成圖像
F
chs20
45
1
Vit Hybrid Base Bit 384
Apache-2.0
混合視覺變換器(ViT)模型結合了卷積網絡和Transformer架構,用於圖像分類任務,在ImageNet上表現出色。
圖像分類 Transformers
V
google
992.28k
6
Convnext Base 224
Apache-2.0
ConvNeXT是一個純卷積模型,設計靈感源自視覺Transformer,在ImageNet-1k數據集上訓練,用於圖像分類任務。
圖像分類 Transformers
C
facebook
2,756
9
Convnext Small 224
Apache-2.0
ConvNeXT是一個純卷積模型,設計靈感來自視覺變換器,在ImageNet-1k數據集上訓練,性能優於傳統視覺變換器。
圖像分類 Transformers
C
facebook
586
5
Convnext Large 224
Apache-2.0
ConvNeXT是一個純卷積模型,設計靈感來自視覺Transformer,在ImageNet-1k數據集上以224x224分辨率訓練而成。
圖像分類 Transformers
C
facebook
740
27
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase