D

Data2vec Vision Base Ft1k

由facebook開發
Data2Vec-Vision是基於BEiT架構的自監督學習模型,在ImageNet-1k數據集上微調,適用於圖像分類任務。
下載量 7,520
發布時間 : 4/14/2022

模型概述

該模型採用自監督方式進行預訓練,並在ImageNet-1k數據集上以224x224分辨率進行微調,可用於將圖像分類為1000個類別。

模型特點

自監督學習
採用自監督學習框架,通過掩碼輸入預測完整輸入的潛在表徵。
多模態統一框架
data2vec框架可統一處理語音、自然語言處理和計算機視覺任務。
高性能圖像分類
在ImageNet-1k上達到83.97%的top-1準確率。

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
圖像分類
將圖像分類為1000個ImageNet類別之一。
在ImageNet-1k上達到83.97%的top-1準確率。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase