Dinov2 With Registers Base
D

Dinov2 With Registers Base

facebookによって開発
DINOv2でトレーニングされた視覚Transformerモデルで、レジスタトークンを追加することでアテンションメカニズムを最適化し、特徴抽出能力を向上
ダウンロード数 22.74k
リリース時間 : 12/20/2024

モデル概要

このモデルはレジスタを備えた視覚Transformer(ViT)のベース版で、DINOv2メソッドを使用した自己教師ありトレーニングにより、画像から高品質の特徴表現を抽出でき、さまざまなコンピュータビジョンタスクに適しています。

モデル特徴

レジスタメカニズム
専用のレジスタトークンを追加することでアテンションマップのアーティファクトを除去し、より明確なアテンション分布を獲得
自己教師あり学習
DINOv2メソッドを使用してトレーニングされ、注釈データなしで意味のある画像特徴表現を学習可能
アテンション最適化
改良されたアテンションメカニズムにより、より解釈可能なアテンションマップを提供し、モデルの意思決定プロセスの理解に役立つ

モデル能力

画像特徴抽出
自己教師あり学習
コンピュータビジョンタスクのベースモデル

使用事例

コンピュータビジョン
画像分類
ベースモデルとして使用可能で、分類ヘッドを追加して画像分類タスクを実行
物体検出
抽出された画像特徴は物体検出タスクに使用可能
画像類似度計算
抽出された特徴ベクトルを使用して画像間の類似度を計算
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase