X

Xgen Mm Phi3 Mini Base R V1.5

由Salesforce開發
xGen-MM是由Salesforce AI Research開發的一系列最新基礎大語言模型(LMMs),在BLIP系列基礎上改進,融入增強功能,具有更強大的基礎能力。
下載量 830
發布時間 : 8/12/2024

模型概述

xGen-MM系列模型在高質量圖像字幕數據集和交錯圖像文本數據上進行了大規模訓練,支持多模態任務處理。

模型特點

多模態上下文學習
具備強大的多模態上下文學習能力,可處理圖像和文本的複雜交互
高性能基準測試
在VQAv2、TextVQA、OKVQA等多個基準測試中表現優異
交錯圖像文本處理
專門優化的交錯圖像文本處理能力,適合複雜多模態場景

模型能力

圖像理解
文本生成
多模態問答
圖像字幕生成
上下文學習

使用案例

視覺問答
圖像內容問答
根據圖像內容回答相關問題
在VQAv2基準測試中達到66.9分
圖像字幕生成
自動圖像描述
為圖像生成準確描述
在COCO基準測試中達到109.8分
多模態交互
複雜場景理解
處理包含多個圖像和文本的複雜場景
在交錯圖像文本任務中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase