nllb - clip - base - ocオープンソース多言語視覚言語モデル - 201種の言語の画像とテキストを組み合わせたアプリを無料でサポート

Home

Nllb Clip Base Oc

Developed by visheratin

NLLB-CLIPはNLLBテキストエンコーダーとCLIP画像エンコーダーを統合した多言語視覚言語モデルで、201言語をサポート

テキスト生成画像 #多言語ゼロショット分類 #低リソース言語最適化 #クロスモーダル検索

Downloads 371

Release Time : 10/7/2023

Model Overview

このモデルはNLLBモデルのテキストエンコード能力とCLIPの画像エンコード能力を組み合わせ、多言語視覚言語理解能力を拡張し、特に低リソース言語で優れた性能を発揮

Model Features

多言語サポート

Flores-200の201言語をサポート、多くの低リソース言語を含む

クロスモーダル理解

テキストと画像のエンコード能力を統合し、視覚言語アラインメントを実現

低リソース言語最適化

低リソース言語で最先端の成果を達成

Model Capabilities

多言語画像分類

クロスモーダル検索

ゼロショット学習

Use Cases

多言語コンテンツ理解

多言語画像タグ付け

画像に対して複数言語の説明タグを生成

Crossmodal-3600データセットで優れた性能

クロスランゲージ画像検索

異なる言語クエリを使用して関連画像を検索

低リソース言語アプリケーション

低リソース言語画像分類

低リソース言語環境での画像分類

低リソース言語でSOTA性能を達成

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers Supports Multiple Languages

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Nllb Clip Base Oc

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 NLLB-CLIP

🚀 クイックスタート

📄 ライセンス

🔖 タグ

📦 データセット

🤝 謝辞