C

Convnextv2 Femto.fcmae

由timm開發
一個基於ConvNeXt-V2的自監督特徵表示模型,採用全卷積掩碼自編碼器框架(FCMAE)進行預訓練。
下載量 166
發布時間 : 1/5/2023

模型概述

該模型是一個圖像分類/特徵主幹網絡,適用於微調或特徵提取任務,未包含預訓練頭部。

模型特點

自監督預訓練
採用全卷積掩碼自編碼器框架(FCMAE)進行預訓練,無需標註數據即可學習有效特徵表示。
輕量級設計
僅4.8百萬參數和0.8 GMACs運算量,適合資源受限環境。
多任務支持
支持圖像分類、特徵圖提取和圖像嵌入等多種計算機視覺任務。

模型能力

圖像特徵提取
圖像分類
生成圖像嵌入

使用案例

計算機視覺
圖像分類
對輸入圖像進行分類,輸出類別概率分佈。
在ImageNet-1k數據集上表現良好
特徵提取
提取圖像的多層次特徵圖,可用於下游任務如目標檢測或分割。
輸出不同尺度的特徵圖
圖像檢索
通過圖像嵌入實現相似圖像檢索。
生成緊湊的圖像表示向量
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase