ResNet - 50オープンソース画像分類モデル - ImageNetをベースに事前学習され、効率的に分類タスクを完了

ホーム

Resnet 50

microsoftによって開発

ResNet-50はImageNet-1kで事前学習された残差ネットワークモデルで、v1.5アーキテクチャの改良を採用し、画像分類タスクに適しています。

画像分類オープンソースライセンス:Apache-2.0 #残差ネットワーク最適化版 #ImageNet分類 #224x224解像度

ダウンロード数 273.80k

リリース時間 : 3/16/2022

モデル概要

ResNet-50は畳み込みニューラルネットワークで、残差学習とスキップ接続により深層モデルの学習を実現します。v1.5バージョンではダウンサンプリング層構造の調整により約0.5%の精度向上を達成しました。

モデル特徴

残差接続設計

スキップ接続を採用し、深層ネットワークの勾配消失問題を解決、超深層ネットワークの学習をサポート

v1.5アーキテクチャ最適化

ダウンサンプリング層構造の調整によりtop1精度が約0.5%向上し、オリジナルv1バージョンより優れている

ImageNet事前学習

ImageNet-1kデータセットで事前学習済み、1000クラスの画像分類に直接使用可能

モデル能力

画像分類

特徴抽出

使用事例

コンピュータビジョン

汎用画像分類

入力画像を1000のImageNetカテゴリに分類

ImageNet-1kで高い精度を達成

転移学習ベースモデル

特定分野の画像分類タスクのファインチューニング用事前学習モデルとして利用可能

🚀 ResNet-50 v1.5

解像度224x224のImageNet-1kで事前学習されたResNetモデルです。Heらによる論文Deep Residual Learning for Image Recognitionで紹介されました。

🚀 クイックスタート

ResNet-50 v1.5は、画像分類タスクに使用できる事前学習済みの畳み込みニューラルネットワークです。以下に、このモデルを使用して画像を分類する基本的な手順を示します。

from transformers import AutoImageProcessor, ResNetForImageClassification
import torch
from datasets import load_dataset

dataset = load_dataset("huggingface/cats-image")
image = dataset["test"]["image"][0]

processor = AutoImageProcessor.from_pretrained("microsoft/resnet-50")
model = ResNetForImageClassification.from_pretrained("microsoft/resnet-50")

inputs = processor(image, return_tensors="pt")

with torch.no_grad():
    logits = model(**inputs).logits

# model predicts one of the 1000 ImageNet classes
predicted_label = logits.argmax(-1).item()
print(model.config.id2label[predicted_label])

✨ 主な機能

ResNetは、残差学習とスキップ接続の概念を広めた畳み込みニューラルネットワークで、より深いモデルの学習を可能にします。
ResNet v1.5は、元のモデルとは異なり、ボトルネックブロックのダウンサンプリング時に3x3畳み込みでストライド=2を使用するため、ResNet50 v1よりも若干精度が高くなります（トップ1精度で約0.5%）。

📚 ドキュメント

モデルの説明

ResNet（Residual Network）は、残差学習とスキップ接続の概念を広めた畳み込みニューラルネットワークです。これにより、より深いモデルの学習が可能になります。

このモデルはResNet v1.5で、元のモデルとは異なり、ダウンサンプリングが必要なボトルネックブロックでは、v1では最初の1x1畳み込みでストライド=2を使用しますが、v1.5では3x3畳み込みでストライド=2を使用します。この違いにより、ResNet50 v1.5はv1よりも若干精度が高くなります（トップ1精度で約0.5%）が、Nvidiaによると、若干のパフォーマンス低下（約5% imgs/sec）があります。

model image

想定用途と制限事項

このモデルは、画像分類に使用できます。関心のあるタスクでファインチューニングされたバージョンを探すには、モデルハブを参照してください。

使い方

COCO 2017データセットの画像を1,000のImageNetクラスのいずれかに分類する方法を以下に示します。

from transformers import AutoImageProcessor, ResNetForImageClassification
import torch
from datasets import load_dataset

dataset = load_dataset("huggingface/cats-image")
image = dataset["test"]["image"][0]

processor = AutoImageProcessor.from_pretrained("microsoft/resnet-50")
model = ResNetForImageClassification.from_pretrained("microsoft/resnet-50")

inputs = processor(image, return_tensors="pt")

with torch.no_grad():
    logits = model(**inputs).logits

# model predicts one of the 1000 ImageNet classes
predicted_label = logits.argmax(-1).item()
print(model.config.id2label[predicted_label])

詳細なコード例については、ドキュメントを参照してください。

BibTeXエントリと引用情報

@inproceedings{he2016deep,
  title={Deep residual learning for image recognition},
  author={He, Kaiming and Zhang, Xiangyu and Ren, Shaoqing and Sun, Jian},
  booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
  pages={770--778},
  year={2016}
}