E

E5 V

由royokong開發
E5-V是基於多模態大語言模型的通用嵌入方法,能夠處理文本和圖像輸入並生成統一的嵌入表示。
下載量 5,619
發布時間 : 7/14/2024

模型概述

E5-V是一個多模態嵌入框架,通過適配多模態大語言模型(MLLMs)來實現跨模態的嵌入表示,有效彌合不同輸入類型之間的模態鴻溝。

模型特點

跨模態統一表示
能夠將文本和圖像輸入映射到統一的嵌入空間,實現跨模態檢索和比較
單模態訓練優化
僅通過文本對訓練即可獲得優於多模態訓練的性能表現
零樣本遷移能力
未經微調也能在多模態嵌入任務中展現出色性能

模型能力

文本嵌入生成
圖像嵌入生成
跨模態檢索
語義相似度計算

使用案例

信息檢索
跨模態搜索
使用文本查詢檢索相關圖像,或使用圖像查詢檢索相關文本
高精度的跨模態匹配能力
內容推薦
多模態內容推薦
基於用戶歷史交互(文本或圖像)推薦相關內容
提升推薦系統的多樣性和準確性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase