U

Unime Phi3.5 V 4.2B

由DeepGlint-AI開發
UniME 是一個基於多模態大模型的通用嵌入學習模型,專注於打破模態壁壘,實現跨模態檢索和嵌入學習。
下載量 54
發布時間 : 4/25/2025

模型概述

UniME 使用文本判別性知識蒸餾和硬負樣本增強的指令調優方法,增強多模態大模型的嵌入能力,支持圖像和文本的跨模態檢索。

模型特點

文本判別性知識蒸餾
通過KL散度對齊學生模型和教師模型在批次相似度分佈上的嵌入,僅微調語言模型組件,其餘參數保持凍結。
硬負樣本增強的指令調優
使用相似度閾值的假負樣本過濾機制和自動硬負樣本採樣策略,提升視覺敏感性、加強跨模態對齊和增強指令跟隨能力。
高分辨率圖像處理
支持336×336圖像分辨率訓練,在多模態嵌入基準測試中表現優異。

模型能力

圖像嵌入
文本嵌入
跨模態檢索
多模態對齊

使用案例

跨模態檢索
圖像到文本檢索
根據圖像內容檢索相關的文本描述。
在MMEB排行榜上位列第一。
文本到圖像檢索
根據文本描述檢索相關的圖像。
在多樣化檢索任務中表現優異。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase