OPENCLIP - SigLIP軽量級視覚言語モデル - オープンソースがゼロショット画像分類タスクを支援

ホーム

OPENCLIP SigLIP Tiny 14 Distill SigLIP 400m Cc9m

PumeTuによって開発

SigLIPアーキテクチャに基づく軽量な視覚言語モデルで、より大きなSigLIP-400mモデルから蒸留技術を用いて知識を抽出し、ゼロショット画像分類タスクに適しています。

画像分類

Safetensors

オープンソースライセンス:MIT #ゼロショット画像分類 #蒸留モデル #小規模事前学習

ダウンロード数 30

リリース時間 : 4/22/2025

モデル概要

このモデルはOpenCLIPフレームワークとSigLIPアーキテクチャを組み合わせ、効率的なゼロショット画像分類に焦点を当てています。蒸留技術により、小規模を維持しながらも大規模モデルの性能を継承しています。

モデル特徴

軽量設計

Tiny-14バージョンは最適化されており、リソースが限られた環境での展開に適しています

知識蒸留

より大きなSigLIP-400mモデルから知識を抽出し、性能と効率のバランスを取っています

ゼロショット能力

特定のタスク訓練なしで画像分類タスクを実行可能

モデル能力

ゼロショット画像分類

マルチモーダル理解

視覚言語アラインメント

使用事例

コンテンツ管理

自動画像タグ付け

未ラベルの画像に対して自動的に記述的なタグを生成

コンテンツ管理効率の向上、手動タグ付けコストの削減

電子商取引

商品分類

アップロードされた画像に基づいて商品を自動分類

商品登録プロセスの簡素化、分類精度の向上

プロパティ	詳細
モデルタイプ	OPENCLIP-SigLIP-Tiny-14-Distill-SigLIP-400m-cc9m
パイプラインタグ	ゼロショット画像分類
ライブラリ名	open_clip
タグ	clip
ライセンス	mit

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

OPENCLIP SigLIP Tiny 14 Distill SigLIP 400m Cc9m

モデル概要

モデル特徴

モデル能力

使用事例

🚀 OPENCLIP-SigLIP-Tiny-14-Distill-SigLIP-400m-cc9m

🚀 クイックスタート

📄 ライセンス