N

Nat Small In1k 224

shi-labsによって開発
NAT-Smallは近隣注意に基づく階層型ビジョントランスフォーマーで、画像分類タスク向けに設計されています
ダウンロード数 6
リリース時間 : 11/18/2022

モデル概要

NATは近隣注意(NA)に基づく階層型ビジョントランスフォーマーで、制限付き自己注意メカニズムを採用し、各トークンの受容野は最も近い隣接ピクセルに限定され、高い柔軟性を保ちながら並進等変性を維持します

モデル特徴

近隣注意メカニズム
スライディングウィンドウ注意モードを採用し、各トークンは最も近い隣接ピクセルのみに注目し、計算効率を維持しながら局所的特徴抽出を実現します
並進等変性
近隣注意設計により、モデルは画像の並進に対する等変特性を保持します
階層構造
階層型ビジョントランスフォーマーアーキテクチャを採用し、異なるスケールの視覚的特徴を処理するのに適しています

モデル能力

画像分類
視覚的特徴抽出

使用事例

コンピュータビジョン
ImageNet分類
画像をImageNetの1,000カテゴリに分類します
物体認識
画像内の主要な物体カテゴリを識別します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase