C

Convnext Base 384

由 facebook 开发
ConvNeXT是一个纯卷积模型,受视觉Transformer设计启发,在ImageNet-1k数据集上以384x384分辨率训练而成,声称性能超越Transformer。
下载量 61
发布时间 : 3/2/2022

模型简介

ConvNeXT是一个现代化的卷积网络模型,主要用于图像分类任务。它从ResNet出发,借鉴了Swin Transformer的设计理念,优化了传统卷积网络的性能。

模型特点

现代化卷积设计
基于ResNet架构,借鉴Transformer设计理念,优化了传统卷积网络的性能。
高性能
在ImageNet-1k数据集上表现出色,声称性能超越Transformer模型。
高分辨率训练
模型在384x384分辨率下训练,适合处理高分辨率图像。

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
ImageNet分类
将图像分类为1000个ImageNet类别之一
高准确率的分类结果
物体识别
识别图像中的主要物体
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase