llava-v1.5-13b-lora開源多模態聊天機器人 - 免費使用實現圖文交互對話

Llava V1.5 13b Lora

由liuhaotian開發

LLaVA 是一個開源的多模態聊天機器人，通過對 LLaMA/Vicuna 進行微調，並基於 GPT 生成的多模態指令跟隨數據訓練而成。

下載量 143

發布時間 : 10/26/2023

模型概述

LLaVA 是一個基於 Transformer 架構的自迴歸語言模型，主要用於研究大型多模態模型和聊天機器人。

多模態能力

結合視覺和語言理解能力，能夠處理圖像和文本的聯合任務

指令跟隨

能夠理解和執行基於多模態輸入的複雜指令

開源模型

基於開源框架開發，可供研究和改進

圖像理解

多模態對話

視覺問答

圖像描述生成

多模態指令理解

學術研究

多模態模型研究

用於研究視覺語言聯合表示和跨模態理解

聊天機器人開發

作為多模態聊天機器人的基礎模型

教育應用

視覺輔助學習

幫助學生通過圖像理解複雜概念

屬性	詳情
模型類型	LLaVA是通過在GPT生成的多模態指令跟隨數據上微調LLaMA/Vicuna而訓練的開源聊天機器人，它是基於Transformer架構的自迴歸語言模型。
模型日期	LLaVA - v1.5 - 13B - LoRA於2023年10月訓練。
更多信息的論文或資源	https://llava-vl.github.io/