C

Convnext Base 224 22k 1k

由facebook開發
ConvNeXT是一個純卷積模型,受視覺Transformer設計啟發,在ImageNet-22k上預訓練並在ImageNet-1k上微調,性能優於傳統Transformer。
下載量 1,879
發布時間 : 3/2/2022

模型概述

ConvNeXT是一個現代化的卷積神經網絡,專為圖像分類任務設計,結合了傳統ConvNet和Transformer的優點。

模型特點

現代化ConvNet設計
從ResNet出發,以Swin Transformer為靈感,現代化了傳統卷積網絡的設計。
高性能圖像分類
在ImageNet-22k和ImageNet-1k數據集上表現出色,性能優於傳統Transformer模型。
純卷積架構
完全基於卷積操作,無需使用Transformer中的自注意力機制。

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
動物識別
識別圖像中的動物種類,如老虎等。
準確分類ImageNet-1k中的1000個類別。
物體識別
識別日常物品,如茶壺等。
準確分類ImageNet-1k中的1000個類別。
場景識別
識別建築和場景,如宮殿等。
準確分類ImageNet-1k中的1000個類別。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase