S

Siglip2 So400m Patch16 512

Developed by google
SigLIP 2はSigLIPを基盤とした視覚言語モデルで、意味理解、位置特定、高密度特徴抽出能力が強化されています。
Downloads 46.46k
Release Time : 2/17/2025

Model Overview

このモデルはゼロショット画像分類や画像テキスト検索などのタスクに使用可能で、視覚言語モデルの視覚エンコーダーとしても利用できます。

Model Features

強化された意味理解
複数の技術を統合し意味理解能力を向上
位置特定能力
画像内オブジェクトの位置特定能力を改善
高密度特徴抽出
より豊富な画像特徴を抽出可能
統合トレーニング手法
複数のトレーニング目標を統合した手法

Model Capabilities

ゼロショット画像分類
画像テキスト検索
視覚特徴抽出

Use Cases

画像分類
ゼロショット画像分類
トレーニング不要で画像を分類
カスタム候補ラベルをサポート
視覚言語タスク
視覚エンコーダー
他の視覚言語モデルの視覚エンコーダーとして使用可能
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase