C

Convnext Large 384

由facebook開發
ConvNeXT是一個純卷積模型(ConvNet),受視覺Transformer設計的啟發,聲稱性能優於Transformer。該模型在ImageNet-1k數據集上以384x384分辨率訓練而成。
下載量 46
發布時間 : 3/2/2022

模型概述

ConvNeXT是一個純卷積模型,用於圖像分類任務,基於ImageNet-1k數據集訓練,支持1000個類別的分類。

模型特點

現代化卷積設計
受視覺Transformer設計的啟發,現代化了卷積網絡的設計,聲稱性能優於Transformer。
高分辨率訓練
模型在384x384分辨率下訓練,適合高分辨率圖像分類任務。
純卷積架構
採用純卷積架構,避免了Transformer的計算複雜度,同時保持了高性能。

模型能力

圖像分類
高分辨率圖像處理

使用案例

圖像識別
動物分類
識別圖像中的動物類別,如老虎、貓等。
準確分類到1000個ImageNet類別之一。
物體識別
識別日常物體,如茶壺、傢俱等。
準確分類到1000個ImageNet類別之一。
場景識別
識別自然或建築場景,如宮殿、森林等。
準確分類到1000個ImageNet類別之一。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase