N

Nllb Clip Base Siglip

visheratinによって開発
NLLB-CLIP-SigLIPは、NLLBモデルのテキストエンコーダとSigLIPモデルの画像エンコーダを組み合わせた多言語視覚言語モデルで、201言語をサポートしています。
ダウンロード数 478
リリース時間 : 11/14/2023

モデル概要

このモデルはNLLBのテキストエンコーディング能力とSigLIPの画像エンコーディング能力を組み合わせており、特に低リソース言語の処理に優れ、クロスモーダルタスクで優れた性能を発揮します。

モデル特徴

多言語サポート
Flores-200の201言語をサポートし、特に低リソース言語の処理に優れています
クロスモーダル能力
テキストと画像のエンコーディング能力を組み合わせ、クロスモーダルタスクに適しています
優れた性能
Crossmodal-3600データセットで最新の技術水準を設定しました

モデル能力

ゼロショット画像分類
多言語テキスト理解
クロスモーダル検索

使用事例

多言語アプリケーション
多言語画像分類
異なる言語を使用して画像を分類する
複数の言語で優れた性能を発揮
クロスモーダル検索
画像とテキストのマッチング
多言語環境で画像とテキストをマッチングする
Crossmodal-3600データセットで優れた性能を発揮
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase