# 高精度特徵提取

GIST Embedding V0
MIT
GIST-Embedding-v0 是一個基於 sentence-transformers 的句子嵌入模型,主要用於句子相似度計算和特徵提取任務。
文本嵌入 英語
G
avsolatorio
252.21k
26
Vit So400m Patch16 Siglip 512.v2 Webli
Apache-2.0
基於SigLIP 2的視覺Transformer模型,專為圖像特徵提取設計,適用於多語言視覺-語言任務。
文本生成圖像 Transformers
V
timm
2,766
0
Aimv2 Large Patch14 448.apple Pt
AIM-v2是一個基於timm庫的圖像特徵提取模型,採用大尺寸補丁設計,適用於高分辨率圖像處理。
圖像分類 Transformers
A
timm
68
0
Aimv2 Large Patch14 224.apple Pt Dist
AIM-v2是一個基於timm庫的圖像編碼器,採用蒸餾訓練方法,適用於圖像特徵提取任務。
圖像分類 Transformers
A
timm
380
1
Aimv2 Huge Patch14 224.apple Pt
AIM-v2是一個高效的圖像編碼器,基於timm庫實現,適用於圖像特徵提取任務。
圖像分類 Transformers
A
timm
93
0
Vit Base Patch16 Siglip 224.webli
Apache-2.0
基於SigLIP的視覺Transformer模型,僅包含圖像編碼器部分,採用原始注意力池化機制
圖像分類 Transformers
V
timm
330
1
Dinov2.large.patch 14.reg 4
Apache-2.0
DINOv2是一個基於視覺變換器的圖像特徵提取模型,通過引入寄存器機制提升了特徵提取能力。
D
refiners
15
0
Dinov2.large.patch 14
Apache-2.0
DINOv2 large是基於自監督學習的大規模視覺特徵提取模型,能夠生成魯棒的圖像特徵表示。
D
refiners
20
0
Cvlface Adaface Vit Base Kprpe Webface12m
MIT
基於關鍵點相對位置編碼的人臉識別模型,採用ViT架構並在WebFace12M數據集上訓練
人臉相關 Transformers 英語
C
minchul
122
1
Cvlface Arcface Ir101 Webface4m
MIT
基於ArcFace損失函數的深度人臉識別模型,使用IR101架構在WebFace4M數據集上訓練
人臉相關 Transformers 英語
C
minchul
44
3
Megadescriptor L 384
基於Swin-L架構的圖像特徵模型,專為動物重識別任務設計,在生態學領域有廣泛應用。
圖像分類 PyTorch
M
BVRA
5,957
8
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase