C

Convnext Base 224 22k

由facebook開發
ConvNeXT是一個純卷積模型,其設計靈感來自視覺Transformer,宣稱性能優於視覺Transformer。該模型在224x224分辨率下基於ImageNet-22k數據集訓練而成。
下載量 1,797
發布時間 : 3/2/2022

模型概述

ConvNeXT是一個純卷積模型(ConvNet),其設計靈感來自視覺Transformer,並宣稱性能優於後者。作者以ResNet為起點,借鑑Swin Transformer的思想對其進行了'現代化'改造。

模型特點

純卷積架構
採用純卷積架構設計,靈感來自視覺Transformer,但性能更優
現代化改造
以ResNet為起點,借鑑Swin Transformer思想進行現代化改造
高分辨率訓練
在224x224分辨率下訓練,適合高精度圖像分類任務

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
通用圖像分類
將圖像分類到ImageNet的22k個類別中
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase