ResNet50 v1.5開源AI模型 - 優化卷積步幅，提升圖像識別準確率

首頁

Test Model

由mchochowski開發

ResNet50 v1.5 是原始 ResNet50 v1 模型的改進版本，通過調整卷積步幅提升了約 0.5% 的 top1 準確率。

圖像分類

Transformers

開源協議:Apache-2.0 #改進版殘差網絡 #混合精度訓練 #Tensor Core加速

下載量 18

發布時間 : 3/2/2022

模型概述

該模型是基於 ResNet 架構的圖像分類模型，主要用於對圖像進行分類任務。

模型特點

改進的卷積步幅

在需要下采樣的瓶頸塊中，v1.5 在 3x3 卷積中設置步幅 = 2，相比 v1 提升了約 0.5% 的 top1 準確率。

混合精度訓練

支持混合精度訓練，利用 Volta、Turing 和 NVIDIA Ampere GPU 架構的 Tensor Core 加速，訓練速度提升 2 倍以上。

多後端部署

支持通過 TorchScript、ONNX Runtime 或 TensorRT 作為後端，部署在 NVIDIA Triton 推理服務器上進行推理。

模型能力

圖像分類

高精度推理

支持 GPU 加速

使用案例

圖像識別

動物識別

識別圖像中的動物種類，如老虎、貓等。

高準確率的分類結果

物體識別

識別日常物體，如茶壺、傢俱等。

高準確率的分類結果

場景識別

識別建築或自然場景，如宮殿、森林等。

高準確率的分類結果

🚀 ResNet50 v1.5 圖像分類模型

ResNet50 v1.5 是一款用於圖像分類的模型，它在原始 ResNet50 v1 模型基礎上進行了改進，提升了一定的準確性，可利用 NVIDIA GPU 架構的 Tensor Cores 進行混合精度訓練，還能部署在 NVIDIA Triton 推理服務器上進行推理。

🚀 快速開始

本模型可用於圖像分類任務，下面將介紹如何使用預訓練的 ResNet50 v1.5 模型對圖像進行推理並展示結果。

✨ 主要特性

改進版本：ResNet50 v1.5 是原始 ResNet50 v1 模型的改進版本，在瓶頸塊的下采樣操作上與 v1 有所不同，使得其準確率比 v1 略高（約 0.5% top1），但性能略有下降（約 5% imgs/sec）。
混合精度訓練：該模型使用 Volta、Turing 和 NVIDIA Ampere GPU 架構上的 Tensor Cores 進行混合精度訓練，研究人員可以比不使用 Tensor Cores 時快 2 倍以上得到結果，同時體驗混合精度訓練的好處。
一致性測試：該模型針對每個 NGC 月度容器版本進行測試，以確保隨著時間的推移保持一致的準確性和性能。
可部署性：ResNet50 v1.5 模型可以使用 TorchScript、ONNX Runtime 或 TensorRT 作為執行後端，部署在 NVIDIA Triton 推理服務器上進行推理。

📦 安裝指南

運行示例需要安裝一些額外的 Python 包，用於圖像預處理和可視化：

!pip install validators matplotlib

💻 使用示例

基礎用法

以下是使用預訓練的 ResNet50 v1.5 模型對圖像進行推理的示例代碼：

import torch
from PIL import Image
import torchvision.transforms as transforms
import numpy as np
import json
import requests
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')
%matplotlib inline

device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
print(f'Using {device} for inference')

加載在 IMAGENET 數據集上預訓練的模型：

resnet50 = torch.hub.load('NVIDIA/DeepLearningExamples:torchhub', 'nvidia_resnet50', pretrained=True)
utils = torch.hub.load('NVIDIA/DeepLearningExamples:torchhub', 'nvidia_convnets_processing_utils')

resnet50.eval().to(device)

準備樣本輸入數據：

uris = [
    'http://images.cocodataset.org/test-stuff2017/000000024309.jpg',
    'http://images.cocodataset.org/test-stuff2017/000000028117.jpg',
    'http://images.cocodataset.org/test-stuff2017/000000006149.jpg',
    'http://images.cocodataset.org/test-stuff2017/000000004954.jpg',
]

batch = torch.cat(
    [utils.prepare_input_from_uri(uri) for uri in uris]
).to(device)

運行推理，使用 pick_n_best(predictions=output, n=topN) 輔助函數根據模型選擇 N 個最可能的假設：

with torch.no_grad():
    output = torch.nn.functional.softmax(resnet50(batch), dim=1)
    
results = utils.pick_n_best(predictions=output, n=5)

顯示結果：

for uri, result in zip(uris, results):
    img = Image.open(requests.get(uri, stream=True).raw)
    img.thumbnail((256,256), Image.ANTIALIAS)
    plt.imshow(img)
    plt.show()
    print(result)