Dinov2 Small ONNX
DINOv2-smallのONNXフォーマットバージョン、視覚タスクに適しています

D
onnx-community
14
0
Vit Large Patch14 Dinov2.lvd142m
Apache-2.0
視覚Transformer(ViT)ベースの画像特徴モデルで、自己教師ありDINOv2手法を用いてLVD-142Mデータセットで事前学習済み。
画像分類
Transformers

V
pcuenq
18
0
Dinov2 With Registers Small Imagenet1k 1 Layer
Apache-2.0
DINOv2でトレーニングされた視覚Transformerモデルで、レジスタトークンを追加することでアテンションメカニズムを改善し、アーティファクトを除去して性能を向上
画像分類
Transformers

D
facebook
445
2
Dinov2.giant.patch 14
Apache-2.0
DINOv2はFacebook研究チームによって開発された視覚特徴抽出モデルで、自己教師あり学習により強力な画像表現能力を獲得しています。
D
refiners
26
0
Dinov2.base.patch 14
Apache-2.0
DINOv2はFacebook Researchが開発した教師なし学習の視覚特徴抽出モデルで、ロバストな視覚特徴表現を生成できます。
D
refiners
18
0
Dinov2.small.patch 14
Apache-2.0
DINOv2はFacebook Researchが開発した視覚特徴抽出モデルで、教師なし学習でロバストな視覚特徴を生成します。
D
refiners
23
0
Vit Small Patch14 Reg4 Dinov2.lvd142m
Apache-2.0
レジスタを備えた視覚Transformer(ViT)画像特徴モデルで、自己教師ありDINOv2手法を用いてLVD-142Mデータセットで事前学習されています。
画像分類
Transformers

V
timm
15.98k
5
Vit Large Patch14 Reg4 Dinov2.lvd142m
Apache-2.0
レジスタ付き視覚トランスフォーマー(ViT)画像特徴モデル、自己教師ありのDINOv2手法でLVD-142Mデータセット上で事前学習済み。
画像分類
Transformers

V
timm
119.48k
7
Vit Giant Patch14 Reg4 Dinov2.lvd142m
Apache-2.0
レジスタを備えた視覚Transformer(ViT)画像特徴モデルで、自己教師ありDINOv2手法を用いてLVD-142Mデータセットで事前学習されています。
画像分類
Transformers

V
timm
917
1
Vit Base Patch14 Reg4 Dinov2.lvd142m
Apache-2.0
レジスタを備えた視覚トランスフォーマー(ViT)画像特徴モデルで、自己教師ありのDINOv2手法を用いてLVD-142Mデータセットで事前学習されています。
画像分類
Transformers

V
timm
40.95k
10
Dinov2 Small Imagenet1k 1 Layer
Apache-2.0
DINOv2手法で訓練された小型視覚Transformerモデルで、画像特徴抽出と分類タスクに適しています
画像分類
Transformers

D
facebook
50.86k
2
Dinov2 Small
Apache-2.0
DINOv2手法でトレーニングされた小型視覚Transformerモデル、自己教師あり学習で画像特徴を抽出
画像分類
Transformers

D
facebook
5.0M
31
Dinov2 Giant
Apache-2.0
DINOv2手法で訓練された視覚Transformerモデル、自己教師あり学習により画像特徴を抽出
画像分類
Transformers

D
facebook
117.56k
41
Dinov2 Large
Apache-2.0
DINOv2手法で訓練されたビジョンTransformerモデル。自己教師あり学習により大量の画像データから頑健な視覚特徴を抽出
画像分類
Transformers

D
facebook
558.78k
79
Dinov2 Base
Apache-2.0
DINOv2手法でトレーニングされた視覚Transformerモデル、自己教師あり学習で画像特徴を抽出
画像分類
Transformers

D
facebook
1.9M
126
Vit Small Patch14 Dinov2.lvd142m
Apache-2.0
視覚Transformer(ViT)ベースの画像特徴モデル、自己教師ありDINOv2手法でLVD-142Mデータセット上で事前学習
画像分類
Transformers

V
timm
35.85k
3
Vit Large Patch14 Dinov2.lvd142m
Apache-2.0
視覚Transformer(ViT)ベースの自己教師あり画像特徴モデルで、DINOv2手法を用いてLVD-142Mデータセットで事前学習されており、画像分類や特徴抽出タスクに適しています。
画像分類
Transformers

V
timm
32.01k
11
Vit Giant Patch14 Dinov2.lvd142m
Apache-2.0
Vision Transformer(ViT)ベースの巨大画像特徴抽出モデル、自己教師ありDINOv2手法でLVD-142Mデータセット上で事前学習
画像分類
Transformers

V
timm
6,911
0
Vit Base Patch14 Dinov2.lvd142m
Apache-2.0
Vision Transformer(ViT)ベースの画像特徴モデル、自己教師ありDINOv2手法でLVD-142Mデータセット上で事前学習済み
画像分類
Transformers

V
timm
50.71k
4
Vit Large Patch16 224.mae
視覚トランスフォーマー(ViT)ベースの大規模画像特徴抽出モデルで、自己教師ありマスクオートエンコーダ(MAE)手法を用いてImageNet-1kデータセットで事前学習済み
画像分類
Transformers

V
timm
960
1
Vit Base Patch16 224.mae
Vision Transformer(ViT)ベースの画像特徴抽出モデル。自己教師ありマスク自己エンコーダ(MAE)手法を用いてImageNet-1kデータセットで事前学習済み
画像分類
Transformers

V
timm
23.63k
2
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98