deeplabv3_mobilenet_v2_1.0_513開源語義分割模型

首頁

Deeplabv3 Mobilenet V2 1.0 513

由Matthijs開發

基於MobileNetV2架構並添加DeepLabV3+頭部的語義分割模型，在PASCAL VOC數據集上預訓練

圖像分割

Transformers

開源協議:其他 #移動端圖像分割 #低功耗模型 #即時語義分割

下載量 164

發布時間 : 6/28/2022

模型概述

這是一個輕量級的語義分割模型，結合了MobileNetV2的高效性和DeepLabV3+的精確分割能力，適用於移動設備和資源受限環境。

模型特點

輕量高效

基於MobileNetV2架構，專為移動設備優化，具有低延遲和低功耗特性

精確分割

結合DeepLabV3+頭部，提供高質量的語義分割結果

預訓練模型

已在PASCAL VOC數據集上以513x513分辨率預訓練，可直接使用

模型能力

圖像語義分割

物體邊界識別

場景理解

使用案例

計算機視覺

自動駕駛場景分割

用於識別道路、行人、車輛等關鍵元素

醫學圖像分析

可用於醫學圖像中的器官或病變區域分割

🚀 MobileNetV2 with DeepLabV3+

本項目是在PASCAL VOC數據集上以513x513分辨率預訓練的MobileNet V2模型。它由Mark Sandler、Andrew Howard、Menglong Zhu、Andrey Zhmoginov和Liang - Chieh Chen在論文MobileNetV2: Inverted Residuals and Linear Bottlenecks中提出，並首次在該倉庫發佈。此模型卡由Hugging Face團隊編寫，因為發佈MobileNet V2的團隊並未為該模型撰寫模型卡。

✨ 主要特性

輕量級設計：MobileNet是小型、低延遲、低功耗的模型，可根據不同用例的資源限制進行參數配置。
多功能應用：可用於分類、檢測、嵌入和分割等任務，類似於其他流行的大規模模型（如Inception）。
高效運行：能夠在移動設備上高效運行，在延遲、模型大小和準確性之間進行權衡，與文獻中的流行模型相比具有優勢。
語義分割能力：本倉庫中的模型在MobileNetV2骨幹網絡上添加了DeepLabV3+頭部，用於語義分割任務。

📚 詳細文檔

模型描述

引用自原始README：

MobileNet是小型、低延遲、低功耗的模型，其參數化設計旨在滿足各種用例的資源限制。它們可以像其他流行的大規模模型（如Inception）一樣，用於構建分類、檢測、嵌入和分割等任務。MobileNet可以在移動設備上高效運行，在延遲、大小和準確性之間進行權衡，並且與文獻中的流行模型相比具有優勢。

本倉庫中的模型在MobileNetV2骨幹網絡上添加了DeepLabV3+頭部，用於語義分割。

預期用途和限制

你可以使用該原始模型進行語義分割。你可以在模型中心查找針對你感興趣的任務進行微調的版本。

💻 使用示例

基礎用法

from transformers import MobileNetV2FeatureExtractor, MobileNetV2ForSemanticSegmentation
from PIL import Image
import requests

url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)

feature_extractor = MobileNetV2FeatureExtractor.from_pretrained("Matthijs/deeplabv3_mobilenet_v2_1.0_513")
model = MobileNetV2ForSemanticSegmentation.from_pretrained("Matthijs/deeplabv3_mobilenet_v2_1.0_513")

inputs = feature_extractor(images=image, return_tensors="pt")

outputs = model(**inputs)
logits = outputs.logits
predicted_mask = logits.argmax(1).squeeze(0)

目前，特徵提取器和模型都支持PyTorch。

BibTeX引用

@inproceedings{deeplabv3plus2018,
  title={Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation},
  author={Liang-Chieh Chen and Yukun Zhu and George Papandreou and Florian Schroff and Hartwig Adam},
  booktitle={ECCV},
  year={2018}
}