C

Convnext Base 384 22k 1k

由facebook開發
ConvNeXT是一個純卷積模型,受視覺Transformer設計啟發,在ImageNet-22k上預訓練並在ImageNet-1k上微調,性能優於Transformer。
下載量 797
發布時間 : 3/2/2022

模型概述

ConvNeXT是一個現代化的卷積神經網絡,專為圖像分類任務設計,結合了傳統卷積網絡和Transformer的優點。

模型特點

純卷積架構
採用純卷積結構,避免了Transformer的計算複雜度,同時保持了高性能。
現代化設計
從ResNet出發,結合Swin Transformer的設計理念,實現了架構的現代化改進。
高性能
在ImageNet等基準測試中表現優異,聲稱性能優於Transformer模型。

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
物體識別
識別圖像中的物體類別,如動物、日常用品等。
可準確分類ImageNet-1k的1,000個類別。
場景分類
對複雜場景進行分類,如識別建築類型、自然環境等。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase