M

Mexma Siglip2

visheratinによって開発
MEXMA-SigLIP2は、MEXMA多言語テキストエンコーダーとSigLIP2画像エンコーダーを組み合わせた高性能CLIPモデルで、80言語をサポートしています。
ダウンロード数 224
リリース時間 : 3/2/2025

モデル概要

このモデルはMEXMA多言語テキストエンコーダーとSigLIP2画像エンコーダーを統合し、クロスモーダル検索機能を実現しており、特にゼロショット画像分類タスクに優れています。

モデル特徴

多言語サポート
80言語をサポートし、アジア、ヨーロッパ、アフリカの多様な言語を含みます
高性能クロスモーダル検索
Crossmodal-3600データセットで新たな最先端レベルを達成
ゼロショット学習能力
タスク固有のファインチューニングなしで画像分類タスクを実行可能

モデル能力

ゼロショット画像分類
クロスモーダル検索
多言語テキスト理解
画像-テキストマッチング

使用事例

画像検索
多言語画像検索
異なる言語のクエリを使用して関連画像を検索
Crossmodal-3600データセットで62.54%の画像検索精度を達成
テキスト検索
画像関連テキスト検索
画像内容に基づいて関連するテキスト記述を検索
Crossmodal-3600データセットで59.99%のテキスト検索精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase