M

MQT LLaVA 7b

由gordonhu開發
MQT-LLaVA是一個開源的多模態聊天機器人模型,基於Transformer架構,通過微調LLaMA/Vicuna在GPT生成的多模態指令數據上訓練而成。
下載量 349
發布時間 : 5/28/2024

模型概述

MQT-LLaVA是一個用於多模態大模型和聊天機器人研究的開源模型,能夠處理圖像和文本輸入並生成文本輸出。

模型特點

開源模型
完全開源,可供研究和商業使用(遵循LLAMA 2許可證)
多模態處理能力
能夠同時處理圖像和文本輸入,生成連貫的文本響應
大規模訓練數據
使用了超過100萬條多模態訓練數據,包括圖像-文本對和指令數據

模型能力

多模態對話
視覺問答
圖像理解與描述
文本生成
指令跟隨

使用案例

學術研究
多模態大模型研究
用於探索視覺-語言聯合表示學習
聊天機器人開發
構建能夠理解圖像內容的對話系統
教育應用
視覺輔助學習
幫助學生通過圖像理解複雜概念
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase