M

Mobilevit Small

Matthijsによって開発
MobileViTは、軽量で低遅延のビジョントランスフォーマーモデルで、CNNとTransformerの利点を組み合わせ、モバイル端末に適しています。
ダウンロード数 39
リリース時間 : 5/11/2022

モデル概要

MobileViTは、画像分類タスクのための軽量な畳み込みニューラルネットワークで、MobileNetV2スタイルの層とTransformerモジュールを組み合わせています。

モデル特徴

軽量設計
モバイル端末向けに最適化されており、低遅延と高効率の特徴を持っています。
CNNとTransformerの組み合わせ
CNNの局所的特徴抽出能力とTransformerのグローバル処理能力を融合しています。
位置符号不要
従来のTransformerにおける位置符号が不要なモデル設計です。

モデル能力

画像分類
マルチスケール特徴抽出

使用事例

コンピュータビジョン
物体認識
画像内の物体カテゴリを識別
ImageNet-1kで78.4%のtop-1精度を達成
シーン分類
画像シーンを分類
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase