D

Data2vec Vision Base

由facebook開發
Data2Vec-Vision是基於BEiT架構的自監督學習模型,在ImageNet-1k數據集上預訓練,適用於圖像分類任務。
下載量 427
發布時間 : 4/14/2022

模型概述

該模型採用data2vec框架,通過自蒸餾方式學習輸入數據的潛在表示,支持計算機視覺任務。

模型特點

通用自監督學習框架
採用統一的data2vec框架,適用於語音、視覺和語言多種模態。
上下文潛在表示預測
通過預測完整輸入數據的潛在表示,而非局部特徵,獲得更豐富的上下文信息。
ImageNet預訓練
在包含120萬張圖像的ImageNet-1k數據集上進行預訓練,具備強大的視覺特徵提取能力。

模型能力

圖像特徵提取
圖像分類

使用案例

計算機視覺
圖像分類
對輸入圖像進行分類,支持1000個ImageNet類別。
在多個圖像分類基準測試中達到或接近最先進水平。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase