M

Mme5 Mllama 11b Instruct

intfloatによって開発
mmE5はLlama-3.2-11B-Visionでトレーニングされたマルチモーダル多言語埋め込みモデルで、高品質な合成データにより埋め込み性能を向上させ、MMEBベンチマークで最先端のレベルを達成しました。
ダウンロード数 596
リリース時間 : 2/13/2025

モデル概要

このモデルはマルチモーダル(画像+テキスト)および多言語埋め込みタスクに特化しており、画像とテキストを統一された埋め込み空間にマッピングし、クロスモーダル検索と類似度計算をサポートします。

モデル特徴

マルチモーダル埋め込み能力
画像とテキスト入力を同時に処理し、それらを統一された埋め込み空間にマッピングできます
多言語サポート
英語、中国語、アラビア語など8言語のテキスト処理をサポート
高品質合成データによるトレーニング
特別に設計された合成データを使用してトレーニングし、モデル性能を向上
最先端の性能
MMEBベンチマークで最先端のレベルを達成

モデル能力

画像-テキスト類似度計算
クロスモーダル検索
多言語テキスト埋め込み
ゼロショット画像分類

使用事例

クロスモーダル検索
画像検索
テキストクエリで関連画像を検索
例:'猫と犬'のクエリと画像のマッチ度0.4219
テキスト検索
画像で関連テキスト記述を検索
例:画像と'猫と犬'のテキストマッチ度0.4414
多言語アプリケーション
多言語画像注釈
画像に対して多言語の説明やラベルを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase