L

Llava Lightning 7B Delta V1 1

由liuhaotian開發
LLaVA是基於LLaMA/Vicuna通過GPT生成的多模態指令跟隨數據微調的開源聊天機器人
下載量 699
發布時間 : 5/3/2023

模型概述

一個結合視覺與語言理解的多模態大模型,主要用於學術研究領域的多模態交互和指令跟隨任務

模型特點

多模態融合
結合視覺與語言理解能力,可處理圖像和文本的聯合輸入
指令跟隨
通過GPT生成的指令數據進行微調,能夠遵循複雜的多模態指令
輕量級訓練
Lightning版本經過優化訓練,相比原始版本更高效

模型能力

圖像理解
視覺問答
多模態對話
圖像描述生成
複雜視覺推理

使用案例

學術研究
多模態交互研究
用於探索視覺與語言模型結合的交互方式
視覺推理基準測試
在ScienceQA等數據集上評估多模態理解能力
與GPT-4協同達到當前最優性能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase