vit_base_patch32_clip_224.laion2b_e16オープンソースモデル - 無料でゼロショット画像分類をサポート

ホーム

Vit Base Patch32 Clip 224.laion2b E16

timmによって開発

LAION-2Bデータセットで訓練されたVision Transformerモデルで、ゼロショット画像分類タスクをサポート

画像分類

Safetensors

オープンソースライセンス:MIT #ゼロショット画像分類 #マルチモーダル事前学習 #LAION-2Bデータセット

ダウンロード数 7,683

リリース時間 : 10/23/2024

モデル概要

これはOpenCLIPとtimmフレームワークの両方で使用可能なデュアルユースモデルで、主にゼロショット画像分類タスクに使用されます。

モデル特徴

デュアルフレームワークサポート

OpenCLIPとtimmフレームワークの両方に対応し、柔軟な使用方法を提供

ゼロショット学習

特定のカテゴリの訓練なしで新しいカテゴリを分類可能

大規模事前学習

LAION-2B大規模データセットで訓練されており、強力な視覚理解能力を有する

モデル能力

ゼロショット画像分類

画像特徴抽出

クロスモーダル理解

使用事例

コンピュータビジョン

画像分類

特定カテゴリの訓練データなしで画像を分類

コンテンツモデレーション

画像内の不適切なコンテンツを識別

マルチモーダルアプリケーション

画像テキストマッチング

画像とテキスト記述の一致度を評価

属性	详情
モデルタイプ	ゼロショット画像分類モデル
学習データ	LAION-2B

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Vit Base Patch32 Clip 224.laion2b E16

モデル概要

モデル特徴

モデル能力

使用事例

🚀 ViT-Base-Patch32 CLIP 224 (LAION-2B E16) モデルカード

🚀 クイックスタート

✨ 主な機能

📦 インストール

💻 使用例

📚 ドキュメント

モデル詳細

🔧 技術詳細

📄 ライセンス