D

Data2vec Vision Large

facebookによって開発
Data2Vec-VisionはBEiTアーキテクチャに基づく自己教師あり学習モデルで、ImageNet-1kデータセットで事前学習されており、画像分類タスクに適しています。
ダウンロード数 225
リリース時間 : 4/14/2022

モデル概要

このモデルはdata2vecフレームワークを採用し、自己蒸留方式で画像データの潜在表現を学習し、コンピュータビジョンタスクをサポートします。

モデル特徴

汎用自己教師あり学習フレームワーク
音声、視覚、言語を含むマルチモーダルタスクを処理する統一されたdata2vecフレームワークを採用
コンテキスト潜在表現予測
局所的な特徴を予測するのではなく、完全な入力情報を含むコンテキスト表現を予測
高性能
複数のベンチマークテストで新しい最高性能を達成または主流の手法と競合する性能

モデル能力

画像分類
視覚的特徴抽出

使用事例

コンピュータビジョン
画像分類
画像を1000クラスに分類
ImageNet-1kベンチマークテストで優れた性能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase