# 軽量ViT

Openvision Vit Base Patch8 160
Apache-2.0
OpenVision-ViT-Tinyは完全オープンで高コストパフォーマンスな先進的な視覚エンコーダで、OpenVisionファミリーの一部であり、マルチモーダル学習に焦点を当てています。
画像分類 Transformers
O
UCSC-VLAA
26
0
Levit 128.fb Dist In1k Finetuned Stroke Binary
Apache-2.0
LeViT-128アーキテクチャに基づく視覚Transformerモデルで、脳卒中二値分類検出タスク向けに微調整
画像分類 Transformers
L
BTX24
18
1
H0 Mini
H0-miniはOwkinとBioptimusが共同開発した軽量な組織学基礎モデルで、Vision Transformerアーキテクチャに基づき、自己教師あり蒸留法で訓練され、病理学画像解析に適しています。
画像分類
H
bioptimus
89
3
Ai Image Detect Distilled
MIT
ViTアーキテクチャに基づく軽量画像分類モデルで、AI生成画像と実画像の差異を検出するために特別に設計
画像分類 Transformers
A
jacoballessio
7,054
2
Vit Tiny Patch8 112.arcface Ms1mv3
MS1MV3データセットで訓練された視覚変換器(ViT)モデルで、顔認識タスク専用です。
人の顔に関係がある
V
gaunernst
371
1
Vit Tiny Patch8 112.cosface Ms1mv3
MS1MV3データセットで訓練された視覚変換器(ViT)モデルで、顔認識タスク向けに設計
人の顔に関係がある
V
gaunernst
28
0
Dinov2 Small Imagenet1k 1 Layer
Apache-2.0
DINOv2手法で訓練された小型視覚Transformerモデルで、画像特徴抽出と分類タスクに適しています
画像分類 Transformers
D
facebook
50.86k
2
Pavit
MIT
PaViTはGoogleのPaLMにインスパイアされたPathway Vision Transformerを基にした画像認識モデルで、少数ショット学習技術の画像認識タスクへの応用に焦点を当てています。
画像分類 複数言語対応
P
Ajibola
20
2
Deit Tiny Distilled Patch16 224
Apache-2.0
このモデルは蒸留版データ効率的画像Transformer(DeiT)で、ImageNet-1kにおいて224x224解像度で事前学習と微調整を行い、教師モデルから効率的に学習します。
画像分類 Transformers
D
facebook
6,016
6
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase