D

Dinat Mini In1k 224

shi-labsによって開発
DiNAT-Miniは近傍アテンション機構に基づく階層型ビジョントランスフォーマーモデルで、画像分類タスク向けに設計されています。
ダウンロード数 462
リリース時間 : 11/14/2022

モデル概要

このモデルは拡張近傍アテンション機構(DiNA)を採用し、ImageNet-1Kデータセットで学習済みで、224x224解像度の画像分類タスクに適しています。

モデル特徴

近傍アテンション機構
制約付き自己アテンション機構を採用し、各トークンの受容野は最近接ピクセルに限定され、並進等変性を保持します。
拡張近傍アテンション
拡張バリアント(DiNA)により受容野を拡張し、柔軟なスライディングウィンドウアテンションパターンを形成します。
階層構造
階層型ビジョントランスフォーマーアーキテクチャを採用し、異なるスケールの視覚特徴を処理するのに適しています。

モデル能力

画像分類
視覚特徴抽出

使用事例

コンピュータビジョン
ImageNet画像分類
入力画像を1000のImageNetカテゴリのいずれかに分類します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase