D

Deeplabv3 Mobilevit X Small

appleによって開発
軽量なビジョントランスフォーマーモデルで、MobileNetV2とトランスフォーマーモジュールを組み合わせ、モバイル向けセマンティックセグメンテーションタスクに適しています。
ダウンロード数 268
リリース時間 : 5/30/2022

モデル概要

このモデルはPASCAL VOCデータセットで事前学習されており、MobileViTの軽量アーキテクチャとDeepLabV3のセマンティックセグメンテーション能力を組み合わせ、リソースが限られた環境での画像セグメンテーションアプリケーションに適しています。

モデル特徴

軽量設計
MobileNetV2の軽量畳み込み層とトランスフォーマーのグローバル処理能力を組み合わせ、モバイルデプロイメントに適しています。
効率的なセグメンテーション
DeepLabV3ヘッド構造を採用し、軽量化を維持しながら高品質なセマンティックセグメンテーションを実現します。
位置エンコーディング不要
MobileViTモジュールはCNNの任意の位置に直接埋め込むことができ、追加の位置エンコーディングが不要です。

モデル能力

画像セマンティックセグメンテーション
モバイル画像処理
リアルタイムセグメンテーションタスク

使用事例

コンピュータビジョン
シーン理解
画像内の異なるオブジェクトをピクセルレベルで分類し、自動運転や監視などのシナリオに適用できます。
PASCAL VOCデータセットで77.1 mIOUを達成
モバイル画像処理
リソースが限られたデバイスでリアルタイムセマンティックセグメンテーションを実現します。
わずか2.9Mパラメータで、モバイルデプロイメントに適しています
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase