D

Dino Vits8

facebookによって開発
DINO手法に基づく自己教師あり学習で訓練されたVision Transformerモデル。8x8画像パッチ処理を使用し、画像特徴抽出タスクに適しています
ダウンロード数 106.97k
リリース時間 : 3/2/2022

モデル概要

このVision Transformerモデルは、ImageNet-1kデータセットでDINO自己教師あり手法を用いて事前訓練されており、画像の内在的な表現を学習可能で、下流のコンピュータビジョンタスクに適用できます

モデル特徴

自己教師あり学習
DINO自己教師あり手法で訓練されており、人手によるアノテーションデータが不要です
8x8画像パッチ処理
画像を8x8ピクセルのパッチに分割して処理するため、局所的な特徴の捕捉に適しています
Transformerアーキテクチャ
Transformerエンコーダアーキテクチャに基づいており、強力な特徴抽出能力を備えています

モデル能力

画像特徴抽出
画像表現学習
コンピュータビジョンタスクの基礎モデル

使用事例

コンピュータビジョン
画像分類
基礎モデルとして使用可能で、分類ヘッドを追加することで画像分類タスクに利用できます
物体検出
抽出された画像特徴は物体検出タスクに利用可能です
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase