D

Deeplabv3 Mobilevit Small

appleによって開発
軽量な視覚Transformerモデルで、MobileNetV2とTransformerモジュールを組み合わせ、モバイル端末向けセマンティックセグメンテーションタスクに適している
ダウンロード数 817
リリース時間 : 5/30/2022

モデル概要

このモデルはMobileViTバックボーンにDeepLabV3ヘッドを追加し、セマンティックセグメンテーションタスク向けに設計されており、PASCAL VOCデータセットで事前学習済み

モデル特徴

軽量設計
MobileNetV2の軽量特性とTransformerのグローバル処理能力を組み合わせ、モバイル展開に適している
効率的なセグメンテーション
DeepLabV3ヘッド構造を採用し、軽量化を維持しながら正確なセマンティックセグメンテーションを実現
マルチスケール学習
事前学習段階で160x160から320x320のマルチスケールサンプリング戦略を採用し、モデルの適応性を強化

モデル能力

画像セマンティックセグメンテーション
モバイル端末画像処理
リアルタイムシーン理解

使用事例

コンピュータビジョン
自動運転シーン理解
道路シーンの異なる物体カテゴリを識別
PASCAL VOCで79.1 mIOUを達成
モバイル端末画像編集
スマートフォンでのリアルタイム背景置換/物体分割機能を実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase