dino - resnet - 50開源模型 - 用於視覺特徵提取的實用工具

首頁

Dino Resnet 50

由Ramos-Ramos開發

使用DINO自監督學習方法預訓練的ResNet-50模型，適用於視覺特徵提取任務

圖像分類

Transformers

#自監督學習 #圖像特徵提取 #ResNet架構

下載量 106

發布時間 : 11/23/2022

模型概述

基於DINO自監督學習框架預訓練的ResNet-50模型，能夠提取高質量的圖像特徵表示，適用於各種計算機視覺任務

模型特點

自監督預訓練

採用DINO自監督學習方法進行預訓練，無需大量標註數據即可學習高質量視覺表示

殘差網絡架構

基於ResNet-50架構，具有優秀的特徵提取能力和訓練穩定性

通用視覺特徵

學習到的特徵表示可遷移到多種下游視覺任務

模型能力

圖像特徵提取

視覺表示學習

圖像分類

目標檢測

圖像相似度計算

使用案例

計算機視覺

圖像分類

作為特徵提取器用於圖像分類任務

目標檢測

作為骨幹網絡用於目標檢測系統

圖像檢索

利用提取的特徵進行圖像相似度匹配

🚀 DINO ResNet-50

DINO ResNet-50 是使用 DINO 進行預訓練的 ResNet-50 模型。DINO 出自論文 Emerging Properties in Self-Supervised Vision Transformers，而 ResNet 則出自 Deep Residual Learning for Image Recognition。DINO ResNet-50 的官方實現可在此處找到。

本項目的權重是使用此腳本從官方 DINO ResNet 轉換而來。

有關最新的模型卡片信息，請參閱原始倉庫。

🚀 快速開始

模型使用

⚠️ 重要提示

本倉庫中的特徵提取器是從 microsoft/resnet-50 複製而來。我們尚未驗證此圖像預處理方法是否適用於 DINO ResNet-50。

from transformers import AutoFeatureExtractor, ResNetModel
from PIL import Image
import requests

url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)

feature_extractor = AutoFeatureExtractor.from_pretrained('Ramos-Ramos/dino-resnet-50')
model = ResNetModel.from_pretrained('Ramos-Ramos/dino-resnet-50')
inputs = feature_extractor(images=image, return_tensors="pt")
outputs = model(**inputs)
last_hidden_states = outputs.last_hidden_state

BibTeX 引用信息

@article{DBLP:journals/corr/abs-2104-14294,
  author    = {Mathilde Caron and
               Hugo Touvron and
               Ishan Misra and
               Herv{\'{e}} J{\'{e}}gou and
               Julien Mairal and
               Piotr Bojanowski and
               Armand Joulin},
  title     = {Emerging Properties in Self-Supervised Vision Transformers},
  journal   = {CoRR},
  volume    = {abs/2104.14294},
  year      = {2021},
  url       = {https://arxiv.org/abs/2104.14294},
  archivePrefix = {arXiv},
  eprint    = {2104.14294},
  timestamp = {Tue, 04 May 2021 15:12:43 +0200},
  biburl    = {https://dblp.org/rec/journals/corr/abs-2104-14294.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

@inproceedings{he2016deep,
  title={Deep residual learning for image recognition},
  author={He, Kaiming and Zhang, Xiangyu and Ren, Shaoqing and Sun, Jian},
  booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
  pages={770--778},
  year={2016}
}