Clip Backdoor Rn50 Cc3m Badnets
MIT
これは事前学習済みのバックドア注入モデルで、コントラスティブ言語画像事前学習におけるバックドアサンプル検出の研究に使用されます。
テキスト生成画像 英語
C
hanxunh
16
0
Vit SO400M 16 SigLIP I18n 256
Apache-2.0
多言語WebLIデータセットで訓練されたSigLIP(言語画像事前訓練のSigmoid損失)モデルで、多言語画像分類タスクをサポートします。
テキスト生成画像
V
timm
82
2
Code
MIT
ディープフェイク画像を検出するためのビジョントランスフォーマーモデルで、コントラスティブ学習とグローバル-ローカル類似性分析により高精度な偽造検出を実現します。
画像分類
Transformers

C
aimagelab
515
2
Japanese Clip Vit B 32 Roberta Base
日本語版CLIPモデルで、日本語テキストと画像を同じ埋め込み空間にマッピングでき、ゼロショット画像分類、テキスト-画像検索などのタスクに適しています。
テキスト生成画像
Transformers 日本語

J
recruit-jp
384
9
Vit H 14 CLIPA 336 Datacomp1b
Apache-2.0
CLIPA-v2モデル、効率的なコントラスティブ画像テキストモデルで、ゼロショット画像分類タスクに特化しています。
テキスト生成画像
V
UCSC-VLAA
493
4
Vit B 16 SigLIP I18n 256
Apache-2.0
WebLIデータセットで訓練されたSigLIP(言語-画像事前学習用のSigmoid損失)モデルで、ゼロショット画像分類タスクに適しています。
テキスト生成画像
V
timm
87.92k
3
Xclip Base Patch16 Ucf 8 Shot
MIT
X-CLIPはCLIPのミニマルな拡張で、一般的なビデオ言語理解のために設計されており、(ビデオ、テキスト)ペアでコントラスティブに訓練され、ゼロショット、少数ショット、または完全教師ありのビデオ分類やビデオ-テキスト検索などのタスクに適しています。
動画処理
Transformers 英語

X
microsoft
16
0
Xclip Base Patch16 Hmdb 16 Shot
MIT
X-CLIPはCLIPの拡張バージョンで、汎用的なビデオと言語の理解に使用され、ビデオ分類とビデオ-テキスト検索タスクをサポートします。
動画処理
Transformers 英語

X
microsoft
49
0
Xclip Base Patch16 Hmdb 2 Shot
MIT
X-CLIPはCLIPの拡張バージョンで、汎用的なビデオと言語の理解のために設計されており、ビデオとテキストのペアでコントラスティブ学習により訓練され、ゼロショット、少数ショット、および完全教師ありのビデオ分類タスクをサポートします。
テキスト生成ビデオ
Transformers 英語

X
microsoft
19
0
Declutr Small
Apache-2.0
DeCLUTR-smallは、深層コントラスティブ学習に基づく汎用文エンコーダーモデルで、高品質な文埋め込み表現を生成します。
テキスト埋め込み 英語
D
johngiorgi
56
3
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98