E

E5 V

royokongによって開発
E5-Vはマルチモーダル大規模言語モデルに基づく汎用埋め込み手法で、テキストと画像の入力を処理し統一された埋め込み表現を生成できます。
ダウンロード数 5,619
リリース時間 : 7/14/2024

モデル概要

E5-Vはマルチモーダル埋め込みフレームワークで、マルチモーダル大規模言語モデル(MLLMs)を適応させることでクロスモーダルな埋め込み表現を実現し、異なる入力タイプ間のモダリティギャップを効果的に埋めます。

モデル特徴

クロスモーダル統一表現
テキストと画像入力を統一された埋め込み空間にマッピングし、クロスモーダル検索と比較を実現
シングルモーダル訓練最適化
テキストペア訓練のみでマルチモーダル訓練を上回る性能を獲得
ゼロショット転移能力
ファインチューニングなしでもマルチモーダル埋め込みタスクで優れた性能を発揮

モデル能力

テキスト埋め込み生成
画像埋め込み生成
クロスモーダル検索
意味的類似度計算

使用事例

情報検索
クロスモーダル検索
テキストクエリで関連画像を検索、または画像クエリで関連テキストを検索
高精度なクロスモーダルマッチング能力
コンテンツ推薦
マルチモーダルコンテンツ推薦
ユーザーの過去のインタラクション(テキストまたは画像)に基づき関連コンテンツを推薦
推薦システムの多様性と精度向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase