nllb - clip - base - ocオープンソース多言語視覚言語モデル - 201種の言語の画像とテキストを組み合わせたアプリを無料でサポート

ホーム

Nllb Clip Base Oc

visheratinによって開発

NLLB-CLIPはNLLBテキストエンコーダーとCLIP画像エンコーダーを統合した多言語視覚言語モデルで、201言語をサポート

テキスト生成画像 #多言語ゼロショット分類 #低リソース言語最適化 #クロスモーダル検索

ダウンロード数 371

リリース時間 : 10/7/2023

モデル概要

このモデルはNLLBモデルのテキストエンコード能力とCLIPの画像エンコード能力を組み合わせ、多言語視覚言語理解能力を拡張し、特に低リソース言語で優れた性能を発揮

モデル特徴

多言語サポート

Flores-200の201言語をサポート、多くの低リソース言語を含む

クロスモーダル理解

テキストと画像のエンコード能力を統合し、視覚言語アラインメントを実現

低リソース言語最適化

低リソース言語で最先端の成果を達成

モデル能力

多言語画像分類

クロスモーダル検索

ゼロショット学習

使用事例

多言語コンテンツ理解

多言語画像タグ付け

画像に対して複数言語の説明タグを生成

Crossmodal-3600データセットで優れた性能

クロスランゲージ画像検索

異なる言語クエリを使用して関連画像を検索

低リソース言語アプリケーション

低リソース言語画像分類

低リソース言語環境での画像分類

低リソース言語でSOTA性能を達成

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Nllb Clip Base Oc

モデル概要

モデル特徴

モデル能力

使用事例

🚀 NLLB-CLIP

🚀 クイックスタート

📄 ライセンス

🔖 タグ

📦 データセット

🤝 謝辞