Comp SigLIP So400M
Apache-2.0
CoMP-MM-1Bはネイティブ画像解像度入力をサポートする視覚基盤モデル(VFM)で、SigLIPを基に継続事前学習されています。
マルチモーダル融合
C
SliMM-X
33
1
Vit Large Patch16 Siglip Gap 384.webli
Apache-2.0
SigLIPベースの視覚Transformerモデルで、グローバル平均プーリングを採用し、画像特徴抽出タスクに適しています。
画像分類
Transformers

V
timm
13
0
Florence 2 Large Ft
MIT
Florence-2はマイクロソフトが開発した先進的な視覚基盤モデルで、プロンプトベースのアプローチで幅広い視覚と言語タスクを処理します。
テキスト生成画像
Transformers

F
microsoft
269.44k
349
Resnet50x16 Clip.openai
MIT
CLIPフレームワークを基にしたResNet50x16視覚モデル、ゼロショット画像分類タスクをサポート
画像分類
R
timm
702
0
Resnet50x4 Clip.openai
MIT
CLIPアーキテクチャに基づくResNet50x4視覚言語モデルで、ゼロショット画像分類タスクをサポート
画像生成テキスト
R
timm
2,303
0
Vit Bigg 14 CLIPA Datacomp1b
Apache-2.0
CLIPA-v2モデル、ゼロショット画像分類タスクに特化し、対比式画像テキスト学習による効率的な視覚表現学習を実現
テキスト生成画像
V
UCSC-VLAA
623
4
Vit H 14 CLIPA 336 Datacomp1b
Apache-2.0
CLIPA-v2モデル、効率的なコントラスティブ画像テキストモデルで、ゼロショット画像分類タスクに特化しています。
テキスト生成画像
V
UCSC-VLAA
493
4
Vit H 14 CLIPA Datacomp1b
Apache-2.0
CLIPA-v2モデル、効率的なコントラスト型画像テキストモデルで、ゼロショット画像分類タスク向けに設計されています。
テキスト生成画像
V
UCSC-VLAA
65
1
Vit H 14 CLIPA 336 Laion2b
Apache-2.0
CLIPA-v2モデル、laion2B-enデータセットでトレーニングされ、ゼロショット画像分類タスクに特化
テキスト生成画像
V
UCSC-VLAA
74
4
Eva02 Enormous Patch14 Plus Clip 224.laion2b S9b B144k
MIT
EVA02アーキテクチャに基づく大規模視覚言語モデル、ゼロショット画像分類タスクをサポート
テキスト生成画像
E
timm
12.57k
8
Eva Giant Patch14 Plus Clip 224.merged2b S11b B114k
MIT
EVA-GiantはCLIPアーキテクチャに基づく大規模視覚-言語モデルで、ゼロショット画像分類タスクをサポートします。
テキスト生成画像
E
timm
1,080
1
Car Brands Classification
Apache-2.0
BEiTアーキテクチャに基づく事前学習済み画像分類モデルで、ベトナム語タグをサポートし、視覚タスクに適しています
画像分類
Transformers その他

C
lamnt2008
19
3
Convnext Large 224 22k 1k
Apache-2.0
ConvNeXTは純粋な畳み込みモデルで、視覚Transformerの設計に触発され、ImageNet-22kで事前学習され、ImageNet-1kで微調整され、従来の視覚Transformerよりも優れた性能を発揮します。
画像分類
Transformers

C
facebook
13.71k
3
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98