🚀 DINO ResNet-50
DINOで事前学習されたResNet-50です。DINOは論文 Emerging Properties in Self-Supervised Vision Transformers で紹介され、ResNetは論文 Deep Residual Learning for Image Recognition で紹介されました。DINO ResNet-50の公式実装は こちら で見ることができます。
公式の DINO ResNet の重みは このスクリプト を使用して変換されています。
最新のモデルカード情報については、元のリポジトリ を参照してください。
🚀 クイックスタート
🔍 タグとデータセット
属性 |
详情 |
タグ |
dino, vision |
データセット |
imagenet-1k |
⚠️ 重要な注意事項
⚠️ 重要提示
このリポジトリの特徴抽出器は、microsoft/resnet-50
のものをコピーしたものです。この画像前処理がDINO ResNet-50で使用されるものかどうかは確認していません。
💻 使用例
基本的な使用法
from transformers import AutoFeatureExtractor, ResNetModel
from PIL import Image
import requests
url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = AutoFeatureExtractor.from_pretrained('Ramos-Ramos/dino-resnet-50')
model = ResNetModel.from_pretrained('Ramos-Ramos/dino-resnet-50')
inputs = feature_extractor(images=image, return_tensors="pt")
outputs = model(**inputs)
last_hidden_states = outputs.last_hidden_state
📚 ドキュメント
BibTeXエントリと引用情報
@article{DBLP:journals/corr/abs-2104-14294,
author = {Mathilde Caron and
Hugo Touvron and
Ishan Misra and
Herv{\'{e}} J{\'{e}}gou and
Julien Mairal and
Piotr Bojanowski and
Armand Joulin},
title = {Emerging Properties in Self-Supervised Vision Transformers},
journal = {CoRR},
volume = {abs/2104.14294},
year = {2021},
url = {https://arxiv.org/abs/2104.14294},
archivePrefix = {arXiv},
eprint = {2104.14294},
timestamp = {Tue, 04 May 2021 15:12:43 +0200},
biburl = {https://dblp.org/rec/journals/corr/abs-2104-14294.bib},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
@inproceedings{he2016deep,
title={Deep residual learning for image recognition},
author={He, Kaiming and Zhang, Xiangyu and Ren, Shaoqing and Sun, Jian},
booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
pages={770--778},
year={2016}
}