D

Dinov2 With Registers Small Imagenet1k 1 Layer

facebookによって開発
DINOv2でトレーニングされた視覚Transformerモデルで、レジスタトークンを追加することでアテンションメカニズムを改善し、アーティファクトを除去して性能を向上
ダウンロード数 445
リリース時間 : 12/21/2024

モデル概要

このモデルはDINOv2手法でトレーニングされた視覚Transformerで、レジスタトークンを導入することでアテンションメカニズムを改善し、より明確なアテンションマップを生成し、画像分類性能を向上させます。

モデル特徴

レジスタメカニズム
事前トレーニング段階でレジスタトークンを追加し、アテンションマップのアーティファクトを除去し、モデルの解釈可能性を向上
改善されたアテンションマップ
レジスタメカニズムにより、より明確で解釈可能なアテンションマップを生成
性能向上
従来のViTモデルと比較して、画像分類タスクで優れたパフォーマンスを発揮

モデル能力

画像分類
特徴抽出
アテンションマップ生成

使用事例

コンピュータビジョン
画像分類
画像を1000種類のImageNetカテゴリに分類
下流タスクの特徴抽出
他のコンピュータビジョンタスクに事前トレーニング済み特徴を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase