eva02_base_patch16_clip_224.merged2b_s8b_b131kオープンソースモデル - ゼロショット画像分類タスクを支援します

ホーム

Eva02 Base Patch16 Clip 224.merged2b S8b B131k

timmによって開発

EVA02アーキテクチャに基づくCLIPモデル、ゼロショット画像分類タスクに適応

テキスト生成画像

Safetensors

オープンソースライセンス:MIT #ゼロショット画像分類 #CLIPアーキテクチャ #マルチモーダル理解

ダウンロード数 29.73k

リリース時間 : 4/10/2023

モデル概要

このモデルはEVA02アーキテクチャに基づくCLIPモデルで、ゼロショット画像分類タスクのために特別に設計されています。視覚と言語の理解能力を組み合わせ、特定のカテゴリの訓練データがなくても分類が可能です。

モデル特徴

ゼロショット学習能力

特定カテゴリの訓練データが不要で分類可能

視覚-言語連携モデリング

画像内容と関連するテキスト記述を同時に理解

効率的なアーキテクチャ

EVA02ベースの改良アーキテクチャで性能と効率のバランスを実現

モデル能力

ゼロショット画像分類

画像-テキストマッチング

クロスモーダル理解

使用事例

画像分類

オープンドメイン画像分類

未見のカテゴリに対する画像分類

様々なゼロショット分類ベンチマークで良好な性能

コンテンツ検索

クロスモーダル検索

テキスト記述に基づく画像検索、または画像に基づく記述生成

属性	详情
モデルタイプ	eva02_base_patch16_clip_224.merged2b_s8b_b131k
パイプラインタグ	ゼロショット画像分類
ライブラリ名	open_clip
タグ	ゼロショット画像分類、clip

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Eva02 Base Patch16 Clip 224.merged2b S8b B131k

モデル概要

モデル特徴

モデル能力

使用事例

🚀 eva02_base_patch16_clip_224.merged2b_s8b_b131k

📄 ライセンス