MobileNet V2开源视觉模型 - 专为移动设备优化，低延迟低功耗超实用！

首页

Mobilenet V2 0.35 96

由 google 开发

MobileNet V2是一种小型、低延迟、低功耗的视觉模型，专为移动设备优化设计

图像分类

Transformers

开源协议:其他 #轻量级图像分类 #移动端优化 #低延迟推理

下载量 540

发布时间 : 11/10/2022

模型简介

MobileNet V2是一种高效的卷积神经网络架构，适用于图像分类任务。该版本在96x96分辨率的ImageNet-1k数据集上进行了预训练，具有0.35的深度乘数。

模型特点

移动设备优化

专为移动设备设计，具有低延迟和低功耗特性

高效架构

采用倒置残差结构和线性瓶颈设计，提高计算效率

可调节参数

支持深度乘数调整，可在精度和效率间取得平衡

模型能力

图像分类

物体识别

使用案例

计算机视觉应用

移动端图像分类

在智能手机等移动设备上实现实时图像分类

可识别1000个ImageNet类别

嵌入式视觉系统

适用于资源受限的嵌入式设备上的视觉处理

🚀 MobileNet V2

MobileNet V2 是一个在 ImageNet-1k 数据集上以 96x96 分辨率预训练的模型。它由 Mark Sandler、Andrew Howard、Menglong Zhu、Andrey Zhmoginov 和 Liang-Chieh Chen 提出，论文为 MobileNetV2: Inverted Residuals and Linear Bottlenecks。该模型首次发布于此仓库。

免责声明

发布 MobileNet V2 的团队并未为此模型撰写模型卡片，此模型卡片由 Hugging Face 团队编写。

🚀 快速开始

你可以使用该原始模型进行图像分类。访问模型中心查找你感兴趣的微调版本。

✨ 主要特性

从原始 README 可知：

MobileNet 是小型、低延迟、低功耗的模型，可根据各种用例的资源限制进行参数调整。与其他流行的大规模模型（如 Inception）类似，它可用于分类、检测、嵌入和分割等任务。MobileNet 可以在移动设备上高效运行 [...] 与文献中的流行模型相比，MobileNet 在延迟、大小和准确性之间进行了权衡。

检查点命名为 mobilenet_v2_depth_size，例如 mobilenet_v2_0.35_96，其中 0.35 是深度乘数，96 是模型训练时输入图像的分辨率。

💻 使用示例

基础用法

以下是如何使用此模型将 COCO 2017 数据集中的图像分类为 1000 个 ImageNet 类别之一的示例：

from transformers import AutoImageProcessor, AutoModelForImageClassification
from PIL import Image
import requests

url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)

preprocessor = AutoImageProcessor.from_pretrained("google/mobilenet_v2_0.35_96")
model = AutoModelForImageClassification.from_pretrained("google/mobilenet_v2_0.35_96")

inputs = preprocessor(images=image, return_tensors="pt")

outputs = model(**inputs)
logits = outputs.logits

# model predicts one of the 1000 ImageNet classes
predicted_class_idx = logits.argmax(-1).item()
print("Predicted class:", model.config.id2label[predicted_class_idx])

⚠️ 重要提示

此模型实际上预测 1001 个类别，即 1000 个 ImageNet 类别加上一个额外的 “背景” 类别（索引 0）。

💡 使用建议

目前，特征提取器和模型均支持 PyTorch。

📚 详细文档

BibTeX 引用和引用信息

@inproceedings{mobilenetv22018,
  title={MobileNetV2: Inverted Residuals and Linear Bottlenecks},
  author={Mark Sandler and Andrew Howard and Menglong Zhu and Andrey Zhmoginov and Liang-Chieh Chen},
  booktitle={CVPR},
  year={2018}
}