X

Xgen Mm Phi3 Mini Base R V1

由Salesforce開發
XGen-MM是Salesforce AI Research開發的最新多模態大模型系列,基於BLIP的成功設計,通過基礎性增強實現了更強大、更優越的模型架構。
下載量 240
發布時間 : 5/7/2024

模型概述

該模型在大規模高質量圖像描述數據集和交錯圖文數據上進行了訓練,支持圖像文本到文本的任務,具有強大的上下文學習能力。

模型特點

強大的預訓練基礎模型
在5B參數規模下達到最先進性能,並展現出強大的上下文學習能力。
靈活的指令微調
指令微調模型在5B參數規模的開源/閉源視覺語言模型中表現最佳。
高分辨率圖像編碼
支持靈活的高分辨率圖像編碼與高效視覺標記採樣。

模型能力

圖像描述生成
視覺問答
多模態上下文學習
高分辨率圖像處理

使用案例

圖像理解與描述
圖像內容描述
生成對圖像內容的詳細描述
示例輸出:狗正坐在海灘上向主人揮手。
視覺問答
基於圖像的問答
回答關於圖像內容的自然語言問題
在OKVQA和TextVQA等基準測試中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase