Data2vec Vision Base
Data2Vec-VisionはBEiTアーキテクチャに基づく自己教師あり学習モデルで、ImageNet-1kデータセットで事前学習されており、画像分類タスクに適しています。
Downloads 427
Release Time : 4/14/2022
Model Overview
このモデルはdata2vecフレームワークを採用し、自己蒸留方式で入力データの潜在表現を学習し、コンピュータビジョンタスクをサポートします。
Model Features
汎用自己教師あり学習フレームワーク
統一されたdata2vecフレームワークを採用し、音声、視覚、言語など複数のモダリティに対応しています。
コンテキスト潜在表現予測
局所的な特徴ではなく、完全な入力データの潜在表現を予測することで、より豊富なコンテキスト情報を獲得します。
ImageNet事前学習
120万枚の画像を含むImageNet-1kデータセットで事前学習されており、強力な視覚特徴抽出能力を備えています。
Model Capabilities
画像特徴抽出
画像分類
Use Cases
コンピュータビジョン
画像分類
入力画像を分類し、1000のImageNetカテゴリをサポートします。
複数の画像分類ベンチマークテストで最先端レベルに達するか、それに近い性能を発揮します。
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98