Pvt Medium 224
Apache-2.0
PVTはTransformerベースの視覚モデルで、ピラミッド構造を使用して画像を処理し、ImageNet-1Kで事前学習されており、画像分類タスクに適しています。
画像分類
Transformers

P
Xrenya
13
0
Nat Base In1k 224
MIT
NAT-BaseはImageNet-1Kで訓練されたビジョントランスフォーマーモデルで、近傍注意メカニズムを使用して画像分類を行います。
画像分類
Transformers その他

N
shi-labs
6
0
Nat Small In1k 224
MIT
NAT-Smallは近隣注意に基づく階層型ビジョントランスフォーマーで、画像分類タスク向けに設計されています
画像分類
Transformers その他

N
shi-labs
6
0
Cvt 13
Apache-2.0
CvT-13は畳み込みニューラルネットワークと視覚トランスフォーマーを組み合わせたハイブリッドアーキテクチャモデルで、ImageNet-1kデータセットで事前学習済み、画像分類タスクに適しています。
画像分類
Transformers

C
microsoft
21.80k
11
Resnet 50
Apache-2.0
ResNet-50はImageNet-1kで事前学習された残差ネットワークモデルで、v1.5アーキテクチャの改良を採用し、画像分類タスクに適しています。
画像分類
R
microsoft
273.80k
407
Resnet 18
Apache-2.0
ImageNet-1kでトレーニングされたResNetモデル、残差接続構造を採用し、画像分類タスクをサポート
画像分類
Transformers

R
microsoft
133.01k
52
Resnet 152
Apache-2.0
ImageNet-1kデータセットで事前学習された深層残差ネットワークモデル、画像分類タスク用
画像分類
Transformers

R
microsoft
18.22k
12
Regnet X 040
Apache-2.0
imagenet-1kでトレーニングされたRegNetモデル、ニューラルアーキテクチャサーチによって設計された効率的な視覚モデル
画像分類
Transformers

R
facebook
69
1
Regnet X 002
Apache-2.0
ImageNet-1kでトレーニングされたRegNet画像分類モデル、ニューラルアーキテクチャサーチによって設計された効率的なネットワーク構造
画像分類
Transformers

R
facebook
60
1
Beit Base Patch16 224
Apache-2.0
BEiTはVision Transformerベースのモデルで、自己教師あり学習によりImageNet-21kで事前学習され、ImageNet-1kでファインチューニングされた画像分類タスク用モデルです。
画像分類
B
microsoft
58.34k
9
Vision Perceiver Conv
Apache-2.0
ImageNetで事前学習された汎用視覚パーシバーモデルで、畳み込み前処理とトランスフォーマーアーキテクチャを採用し、画像分類タスクをサポート
画像分類
Transformers

V
deepmind
7,127
6
Beit Large Patch16 224
Apache-2.0
BEiTはVision Transformer(ViT)アーキテクチャに基づく画像分類モデルで、自己教師あり学習によりImageNet-21kで事前学習され、ImageNet-1kでファインチューニングされています。
画像分類
B
microsoft
222.46k
1
Convnext Large 224 22k 1k
Apache-2.0
ConvNeXTは純粋な畳み込みモデルで、視覚Transformerの設計に触発され、ImageNet-22kで事前学習され、ImageNet-1kで微調整され、従来の視覚Transformerよりも優れた性能を発揮します。
画像分類
Transformers

C
facebook
13.71k
3
Beit Base Patch16 384
Apache-2.0
BEiTはビジョントランスフォーマーアーキテクチャに基づく画像分類モデルで、ImageNet-21kで自己教師あり方式で事前学習され、ImageNet-1kでファインチューニングされています。
画像分類
B
microsoft
146
5
Resnet50
ImageNetデータセットで事前学習された深層残差ネットワークモデルで、画像分類タスクに使用されます。
画像分類
Transformers

R
leftthomas
18
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98