C

Convnext Base 384

由facebook開發
ConvNeXT是一個純卷積模型,受視覺Transformer設計啟發,在ImageNet-1k數據集上以384x384分辨率訓練而成,聲稱性能超越Transformer。
下載量 61
發布時間 : 3/2/2022

模型概述

ConvNeXT是一個現代化的卷積網絡模型,主要用於圖像分類任務。它從ResNet出發,借鑑了Swin Transformer的設計理念,優化了傳統卷積網絡的性能。

模型特點

現代化卷積設計
基於ResNet架構,借鑑Transformer設計理念,優化了傳統卷積網絡的性能。
高性能
在ImageNet-1k數據集上表現出色,聲稱性能超越Transformer模型。
高分辨率訓練
模型在384x384分辨率下訓練,適合處理高分辨率圖像。

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
ImageNet分類
將圖像分類為1000個ImageNet類別之一
高準確率的分類結果
物體識別
識別圖像中的主要物體
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase