R

Resnet50 Clip Gap.openai

由timm開發
基於CLIP模型視覺編碼器部分的ResNet50變體,通過全局平均池化(GAP)提取圖像特徵
下載量 250
發布時間 : 12/26/2024

模型概述

該模型是CLIP視覺編碼器的ResNet50架構實現,專門用於圖像特徵提取,可作為計算機視覺任務的基礎特徵提取器

模型特點

CLIP視覺編碼器
基於CLIP模型的視覺編碼器部分,具有強大的跨模態表示能力
全局平均池化
使用全局平均池化(GAP)代替全連接層,更適合特徵提取任務
預訓練權重
使用OpenAI CLIP的預訓練權重,具有優秀的圖像表示能力

模型能力

圖像特徵提取
視覺表示學習

使用案例

計算機視覺
圖像分類
作為基礎特徵提取器用於圖像分類任務
圖像檢索
提取圖像特徵用於相似性搜索和檢索
多模態學習
與文本模型結合用於跨模態學習任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase