X

Xgen Mm Phi3 Mini Instruct Dpo R V1.5

由Salesforce開發
xGen-MM是Salesforce AI Research開發的多模態基礎模型系列,基於BLIP系列改進,在高質量圖像字幕和交錯圖文數據上訓練。
下載量 305
發布時間 : 8/9/2024

模型概述

該模型是xGen-MM系列的DPO(Direct Preference Optimization)版本,專注於提升多模態理解能力和安全性,適用於圖像文本生成和交互任務。

模型特點

多模態理解
在單圖像和多圖像基準測試中表現優異,支持複雜的多模態交互任務。
安全優化
通過DPO訓練顯著降低有害內容生成概率(VLGuard得分5.2,優於基準模型)。
綜合性能
在POPE、MMBench、SEED-IMG等多個基準測試中超越同類模型。

模型能力

圖像描述生成
多圖像推理
安全內容過濾
視覺問答
跨模態理解

使用案例

內容審核
有害內容檢測
自動識別圖像和文本中的潛在有害內容
VLGuard得分5.2(越低越好)
教育
多模態學習助手
解析教材中的圖文內容並生成解釋
MMBench開發集得分76.4
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase