D

Data2vec Vision Large

由facebook開發
Data2Vec-Vision是基於BEiT架構的自監督學習模型,在ImageNet-1k數據集上預訓練,適用於圖像分類任務。
下載量 225
發布時間 : 4/14/2022

模型概述

該模型採用data2vec框架,通過自蒸餾方式學習圖像數據的潛在表示,支持計算機視覺任務。

模型特點

通用自監督學習框架
採用統一的data2vec框架處理多模態任務,包括語音、視覺和語言
上下文潛在表示預測
不同於預測局部特徵,模型預測包含完整輸入信息的上下文表示
高性能表現
在多個基準測試中達到新的最優性能或與主流方法競爭的表現

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
圖像分類
對圖像進行1000個類別的分類
在ImageNet-1k基準測試中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase