M

Metaclip L14 400m

facebookによって開発
MetaCLIPはCommonCrawlデータでトレーニングされた視覚-言語モデルで、画像とテキストの共有埋め込み空間を構築します。
ダウンロード数 325
リリース時間 : 10/9/2023

モデル概要

このモデルはCLIPのトレーニングデータ選別方法を分析し、画像とテキストの共有埋め込み空間を構築し、さまざまなクロスモーダルタスクをサポートします。

モデル特徴

大規模データトレーニング
CommonCrawlの4億データポイントでトレーニング
クロスモーダル理解
画像とテキストの共有埋め込み空間を構築
ゼロショット能力
特定タスクのトレーニング不要なゼロショット分類をサポート

モデル能力

画像分類
テキストから画像検索
画像からテキスト検索
クロスモーダル理解

使用事例

コンテンツ検索
テキストベースの画像検索
自然言語記述を使用して関連画像を検索
コンテンツ分類
ゼロショット画像分類
トレーニングなしで新規カテゴリの画像を分類
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase