D

Deit Base Distilled Patch16 384

由facebook開發
蒸餾版視覺Transformer模型,先在224x224分辨率下預訓練,再於384x384分辨率下在ImageNet-1k上微調,通過蒸餾標記從教師模型中學習。
下載量 1,824
發布時間 : 3/2/2022

模型概述

該模型是一個蒸餾版視覺Transformer(ViT),用於圖像分類任務。它使用蒸餾標記從教師CNN模型中學習,支持高分辨率圖像處理。

模型特點

蒸餾學習
通過蒸餾標記從教師CNN模型中學習,提高模型性能。
高分辨率支持
支持384x384分辨率圖像處理,提升分類精度。
數據高效
在ImageNet-1k上預訓練和微調,數據使用高效。

模型能力

圖像分類
高分辨率圖像處理

使用案例

計算機視覺
ImageNet圖像分類
將圖像分類為1000個ImageNet類別之一。
Top-1準確率85.2%,Top-5準確率97.2%。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase