D

Data2vec Vision Large Ft1k

由facebook開發
Data2Vec-Vision是一個基於BEiT架構的自監督學習視覺模型,在ImageNet-1k數據集上微調,適用於圖像分類任務。
下載量 68
發布時間 : 4/14/2022

模型概述

該模型採用data2vec框架,通過自蒸餾方式學習圖像特徵,能夠將輸入圖像分類為1000個ImageNet類別。

模型特點

通用自監督學習框架
採用data2vec框架,統一適用於語音、自然語言處理和計算機視覺任務
自蒸餾學習
通過預測完整輸入的潛在表徵進行訓練,而非傳統的局部預測目標
高性能圖像分類
在ImageNet-1k上達到86.5%的top-1準確率

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
通用圖像分類
將任意圖像分類為1000個ImageNet類別
top-1準確率86.5%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase