MobileNet V2开源视觉模型 - 专为移动设备优化，高效完成图像分类

首页

Mobilenet V2 1.0 224

由 google 开发

MobileNet V2 是一个轻量级的视觉模型，专为移动设备优化，在图像分类任务上表现优异。

图像分类

Transformers

开源协议:其他 #轻量级图像分类 #移动端优化 #低延迟推理

下载量 69.47k

发布时间 : 11/10/2022

模型简介

MobileNet V2是基于ImageNet-1k数据集预训练的轻量级卷积神经网络模型，适用于图像分类任务。该模型通过倒置残差结构和线性瓶颈设计，在保持高准确率的同时显著减少了计算量和参数数量。

模型特点

轻量级设计

专为移动和嵌入式设备优化，计算量和参数数量较少

高效架构

采用倒置残差结构和线性瓶颈设计，提高计算效率

高准确率

在保持轻量级的同时，与大型模型相比仍具有竞争力的准确率

模型能力

图像分类

视觉特征提取

使用案例

计算机视觉

物体识别

识别图像中的物体类别

可分类1000种ImageNet类别

移动端视觉应用

适用于智能手机等移动设备上的实时视觉应用

低延迟、低功耗运行

🚀 MobileNet V2

MobileNet V2 是一个在 ImageNet-1k 数据集上以 224x224 分辨率预训练的模型。它能高效地处理图像分类任务，为资源受限的设备提供了轻量级的解决方案。

🚀 快速开始

你可以使用这个预训练的模型进行图像分类。以下是一个使用示例，展示了如何将 COCO 2017 数据集中的一张图像分类到 1000 个 ImageNet 类别之一：

from transformers import AutoImageProcessor, AutoModelForImageClassification
from PIL import Image
import requests

url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)

preprocessor = AutoImageProcessor.from_pretrained("google/mobilenet_v2_1.0_224")
model = AutoModelForImageClassification.from_pretrained("google/mobilenet_v2_1.0_224")

inputs = preprocessor(images=image, return_tensors="pt")

outputs = model(**inputs)
logits = outputs.logits

# model predicts one of the 1000 ImageNet classes
predicted_class_idx = logits.argmax(-1).item()
print("Predicted class:", model.config.id2label[predicted_class_idx])

注意：此模型实际上预测 1001 个类别，即 1000 个 ImageNet 类别加上一个额外的“背景”类别（索引 0）。目前，特征提取器和模型都支持 PyTorch。

✨ 主要特性

轻量级设计：MobileNets 是小型、低延迟、低功耗的模型，可参数化以满足各种用例的资源限制。
多功能性：可用于分类、检测、嵌入和分割等任务，类似于其他流行的大规模模型（如 Inception）。
高效运行：能够在移动设备上高效运行。
权衡优势：在延迟、大小和准确性之间进行权衡，与文献中的流行模型相比具有优势。

📚 详细文档

模型描述

根据原始 README：

MobileNets 是小型、低延迟、低功耗的模型，可参数化以满足各种用例的资源限制。它们可以像其他流行的大规模模型（如 Inception）一样，用于分类、检测、嵌入和分割等任务。MobileNets 可以在移动设备上高效运行 [...] MobileNets 在延迟、大小和准确性之间进行权衡，与文献中的流行模型相比具有优势。

检查点命名为 mobilenet_v2_depth_size，例如 mobilenet_v2_1.0_224，其中 1.0 是深度乘数，224 是模型训练时输入图像的分辨率。

预期用途和限制

你可以使用原始模型进行图像分类。请查看模型中心以查找针对你感兴趣的任务进行微调的版本。

BibTeX 引用和引用信息

@inproceedings{mobilenetv22018,
  title={MobileNetV2: Inverted Residuals and Linear Bottlenecks},
  author={Mark Sandler and Andrew Howard and Menglong Zhu and Andrey Zhmoginov and Liang-Chieh Chen},
  booktitle={CVPR},
  year={2018}
}