# 大規模視覺編碼

Siglip2 Giant Opt Patch16 256
Apache-2.0
SigLIP 2 是一個先進的視覺語言模型,整合了多項技術以提升語義理解、定位和密集特徵提取能力。
文本生成圖像 Transformers
S
google
3,936
1
Aimv2 3b Patch14 224.apple Pt
AIM-v2是一個高效的圖像編碼器模型,兼容timm框架,適用於計算機視覺任務。
圖像分類 Transformers
A
timm
50
0
Aimv2 Large Patch14 224 Distilled
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多模態理解基準測試中表現優異。
圖像分類
A
apple
236
0
Aimv2 3B Patch14 448
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多個視覺理解基準測試中表現優異。
圖像分類
A
apple
161
12
Aimv2 1B Patch14 448
AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列,在多個視覺理解基準測試中表現優異。
圖像分類
A
apple
71
0
Aimv2 Huge Patch14 448
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多個基準測試中表現優異。
圖像分類
A
apple
1,672
3
Aimv2 Large Patch14 448
AIMv2是基於多模態自迴歸目標預訓練的視覺模型系列,在多個基準測試中表現優異
圖像分類
A
apple
2,210
5
Aimv2 3B Patch14 336
AIMv2 是一個通過多模態自迴歸目標預訓練的視覺模型系列,在多個多模態理解基準測試中表現優異。
圖像分類
A
apple
23
2
Aimv2 Large Patch14 336
AIMv2是基於多模態自迴歸目標預訓練的視覺模型系列,在多項視覺任務中表現優異。
圖像分類
A
apple
6,177
3
Aimv2 1B Patch14 224
AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列,在多項視覺任務中表現優異。
圖像分類
A
apple
299
7
Aimv2 Huge Patch14 224
AIMv2 是通過多模態自迴歸目標預訓練的視覺模型系列,在多項基準測試中表現優異。
圖像分類
A
apple
54
9
Aimv2 Large Patch14 224
AIMv2是通過多模態自迴歸目標預訓練的視覺模型系列,在多項視覺任務中表現優異。
圖像分類
A
apple
759
50
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase