C

Convnext Large 384 22k 1k

由facebook開發
ConvNeXT是一個純卷積模型,受視覺Transformer設計啟發,在ImageNet-22k上預訓練並在ImageNet-1k上微調,性能優於傳統Transformer。
下載量 73
發布時間 : 3/2/2022

模型概述

ConvNeXT是一個現代化的卷積神經網絡,專為圖像分類任務設計,通過借鑑Transformer的優點提升了傳統卷積網絡的性能。

模型特點

現代化卷積設計
從ResNet出發,借鑑Swin Transformer的設計理念,對傳統卷積網絡進行了現代化改進。
高性能圖像分類
在ImageNet-22k和ImageNet-1k數據集上表現出色,性能優於同類Transformer模型。
高分辨率支持
支持384x384高分辨率圖像輸入,能夠捕捉更精細的圖像特徵。

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
物體識別
識別圖像中的物體類別,如動物、日常用品等。
示例中成功識別出老虎、茶壺等物體。
場景分類
對圖像場景進行分類,如識別建築類型、自然景觀等。
示例中成功識別出宮殿等場景。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase