M

MGM 7B

由YanweiLi開發
MGM-7B是基於Vicuna-7B-v1.5訓練的開源多模態聊天機器人,支持高清圖像理解、推理與生成。
下載量 975
發布時間 : 3/26/2024

模型概述

MGM-7B是一個視覺語言模型,通過在多模態指令數據上微調LLaMA/Vicuna實現,能夠同步處理高清圖像理解和生成任務。

模型特點

高清圖像處理
支持同步實現高清圖像理解、推理與生成
多模態能力
結合視覺和語言理解能力,實現圖像與文本的交互
參數規模可選
提供從20億到340億參數的不同規模模型選擇

模型能力

圖像理解
多模態推理
圖像生成
自然語言對話

使用案例

研究應用
多模態模型研究
用於計算機視覺和自然語言處理的交叉研究
聊天機器人開發
開發具備圖像理解能力的智能對話系統
創意應用
圖像描述生成
根據輸入圖像生成詳細文字描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase