M

Mobilevit X Small

appleによって開発
MobileViTは、軽量で低遅延の視覚Transformerモデルで、CNNとTransformerの利点を組み合わせ、モバイル端末に適しています。
ダウンロード数 1,062
リリース時間 : 5/30/2022

モデル概要

このモデルはImageNet-1kデータセットで事前訓練され、画像分類タスクに使用され、軽量で効率的な特徴を持っています。

モデル特徴

軽量設計
モバイル端末向けに最適化され、パラメータ数はわずか2.3Mで、リソースが限られた環境での展開に適しています。
ハイブリッドアーキテクチャ
MobileNetV2のCNN層とTransformerモジュールを組み合わせ、局所的およびグローバルな特徴処理能力を兼ね備えています。
マルチスケール訓練
訓練時にマルチスケールサンプラー(160x160から320x320)を使用し、異なる解像度の画像に対するモデルの適応能力を強化します。

モデル能力

画像分類
視覚的特徴抽出

使用事例

コンピュータビジョン
物体認識
画像内の物体カテゴリ(動物、日用品など)を識別
ImageNet-1kで74.8%のtop-1精度を達成
モバイル端末視覚アプリケーション
スマートフォンなどのモバイルデバイス向けリアルタイム画像分類シーンに適しています
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase