D

Dinov2 Large

facebookによって開発
DINOv2手法で訓練されたビジョンTransformerモデル。自己教師あり学習により大量の画像データから頑健な視覚特徴を抽出
ダウンロード数 558.78k
リリース時間 : 7/17/2023

モデル概要

このモデルはTransformerエンコーダアーキテクチャを採用し、自己教師あり方式で事前訓練されており、画像の内在的表現を学習可能。様々なコンピュータビジョン下流タスクの特徴抽出に適応

モデル特徴

自己教師あり学習
人手によるアノテーションデータが不要で、大量の画像から自己教師あり方式で特徴を学習
頑健な視覚特徴
多様な下流タスクに適用可能な汎用視覚特徴を抽出可能
Transformerアーキテクチャ
先進的なTransformerエンコーダ構造に基づき、画像データを効果的に処理

モデル能力

画像特徴抽出
視覚表現学習
コンピュータビジョンタスクの基盤モデル

使用事例

コンピュータビジョン
画像分類
事前訓練モデルに分類ヘッドを追加してファインチューニング
物体検出
特徴抽出器として物体検出タスクに利用
画像類似度計算
抽出した特徴ベクトルを用いて画像類似度を計算
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase