N

Nllb Siglip Mrl Large

visheratinによって開発
NLLB-SigLIP-MRLは、NLLBモデルのテキストエンコーダとSigLIPモデルの画像エンコーダを組み合わせた多言語ビジュアル言語モデルで、Flores-200の201言語をサポートします。
ダウンロード数 297
リリース時間 : 3/4/2024

モデル概要

このモデルは、NLLBのテキストエンコード能力とSigLIPの画像エンコード能力を組み合わせ、マトリョーシカ表現学習によって訓練され、複数の埋め込みサイズをサポートし、多言語画像およびテキスト検索タスクで最先端のレベルに達しています。

モデル特徴

多言語サポート
Flores-200の201言語をサポートし、モデルの多言語能力を拡張します。
可変埋め込みサイズ
[32, 64, 128, 256, 512]などの複数の埋め込みサイズをサポートし、256と512のサイズでは90%以上の完全な埋め込み品質が保持されます。
最先端の性能
XTD10とCrossmodal-3600データセットで、多言語画像およびテキスト検索に新たな最先端レベルを設定しました。

モデル能力

多言語画像分類
多言語テキスト検索
多言語画像検索
ゼロショット学習

使用事例

多言語コンテンツ検索
クロス言語画像検索
異なる言語のテキストクエリを使用して関連する画像を検索する
Crossmodal-3600データセットで画像検索R@1が0.6079に達しました
多言語画像分類
異なる言語のラベルを使用して画像を分類する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase