C

Convnext Base.clip Laion2b Augreg

由timm開發
基於CLIP框架的ConvNeXt Base圖像編碼器,使用LAION-2B數據集訓練,支持圖像特徵提取
下載量 522
發布時間 : 12/24/2024

模型概述

該模型是CLIP框架中的圖像編碼器部分,採用ConvNeXt Base架構,通過LAION-2B數據集訓練,能夠高效提取圖像特徵,適用於視覺-語言任務。

模型特點

高效的圖像特徵提取
採用ConvNeXt Base架構,能夠高效地從圖像中提取有意義的特徵
大規模數據集訓練
使用LAION-2B數據集訓練,具有強大的泛化能力
CLIP框架兼容
作為CLIP框架的圖像編碼器部分,可與文本編碼器配合完成跨模態任務

模型能力

圖像特徵提取
視覺表示學習
跨模態對齊

使用案例

計算機視覺
圖像檢索
通過提取圖像特徵實現高效的圖像檢索
視覺-語言任務
作為CLIP框架的一部分,可用於圖像-文本匹配等任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase