D

Dino Vits16

facebookによって開発
DINO手法に基づく自己教師あり学習で訓練された視覚Transformerモデル、画像特徴抽出に適しています
ダウンロード数 47.32k
リリース時間 : 3/2/2022

モデル概要

この視覚TransformerモデルはImageNet-1kデータセットで自己教師あり方式で事前学習されており、下流タスク向けに画像特徴を抽出できます

モデル特徴

自己教師あり学習
DINO手法を用いた自己教師あり学習を採用、人手による注釈データが不要です
画像パッチ処理
画像を16x16ピクセルのパッチに分割して処理します
汎用特徴抽出
学習された画像表現は様々な下流視覚タスクに転移可能です

モデル能力

画像特徴抽出
画像分類基盤モデル
視覚的表現学習

使用事例

コンピュータビジョン
画像分類
事前学習モデルに分類ヘッドを追加してファインチューニングします
物体検出
特徴抽出器として物体検出タスクに使用します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase