D

Data2vec Vision Large

由 facebook 开发
Data2Vec-Vision是基于BEiT架构的自监督学习模型,在ImageNet-1k数据集上预训练,适用于图像分类任务。
下载量 225
发布时间 : 4/14/2022

模型简介

该模型采用data2vec框架,通过自蒸馏方式学习图像数据的潜在表示,支持计算机视觉任务。

模型特点

通用自监督学习框架
采用统一的data2vec框架处理多模态任务,包括语音、视觉和语言
上下文潜在表示预测
不同于预测局部特征,模型预测包含完整输入信息的上下文表示
高性能表现
在多个基准测试中达到新的最优性能或与主流方法竞争的表现

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
图像分类
对图像进行1000个类别的分类
在ImageNet-1k基准测试中表现优异
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase