D

Data2vec Vision Base

facebookによって開発
Data2Vec-VisionはBEiTアーキテクチャに基づく自己教師あり学習モデルで、ImageNet-1kデータセットで事前学習されており、画像分類タスクに適しています。
ダウンロード数 427
リリース時間 : 4/14/2022

モデル概要

このモデルはdata2vecフレームワークを採用し、自己蒸留方式で入力データの潜在表現を学習し、コンピュータビジョンタスクをサポートします。

モデル特徴

汎用自己教師あり学習フレームワーク
統一されたdata2vecフレームワークを採用し、音声、視覚、言語など複数のモダリティに対応しています。
コンテキスト潜在表現予測
局所的な特徴ではなく、完全な入力データの潜在表現を予測することで、より豊富なコンテキスト情報を獲得します。
ImageNet事前学習
120万枚の画像を含むImageNet-1kデータセットで事前学習されており、強力な視覚特徴抽出能力を備えています。

モデル能力

画像特徴抽出
画像分類

使用事例

コンピュータビジョン
画像分類
入力画像を分類し、1000のImageNetカテゴリをサポートします。
複数の画像分類ベンチマークテストで最先端レベルに達するか、それに近い性能を発揮します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase