resnet50_clip.openaiオープンソースのゼロショット画像分類モデル

ホーム

Resnet50 Clip.openai

timmによって開発

ResNet50アーキテクチャとCLIP技術に基づくゼロショット画像分類モデル

画像分類

Safetensors

オープンソースライセンス:MIT #ゼロショット分類 #マルチモーダル理解 #オープンドメイン認識

ダウンロード数 11.91k

リリース時間 : 6/9/2024

モデル概要

このモデルはResNet50の視覚的特徴抽出能力とCLIPのクロスモーダル理解能力を組み合わせ、ゼロショット画像分類タスクに適しています。

モデル特徴

ゼロショット学習

特定のカテゴリのトレーニングデータがなくても新しいカテゴリを分類可能

クロスモーダル理解

視覚とテキスト情報を組み合わせた画像分類

効率的なアーキテクチャ

ResNet50ベースの性能と効率のバランスが取れたアーキテクチャ

モデル能力

ゼロショット画像分類

クロスモーダル画像理解

マルチカテゴリ画像認識

使用事例

コンテンツ管理

自動画像タグ付け

未タグ付け画像に自動的に記述タグを生成

コンテンツ管理効率の向上

電子商取引

製品分類

自然言語記述に基づく新製品の分類

新製品カテゴリごとにモデルを再トレーニングする必要がない

プロパティ	詳細
モデルタイプ	ResNet50 CLIP
ライブラリ名	OpenCLIP
パイプラインタグ	Zero-Shot画像分類
ライセンス	MIT

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Resnet50 Clip.openai

モデル概要

モデル特徴

モデル能力

使用事例

🚀 ResNet50 CLIP モデルカード

🚀 クイックスタート

📄 ライセンス