LLaVA-13b-delta-v0開源聊天機器人 - 基於多模態數據支持自然對話體驗

Llava 13b Delta V0

由liuhaotian開發

LLaVA是基於LLaMA/Vicuna通過GPT生成的多模態指令跟隨數據微調的開源聊天機器人，屬於基於Transformer架構的自迴歸語言模型。

下載量 352

發布時間 : 4/17/2023

模型概述

LLaVA是一個多模態大模型，結合了視覺和語言處理能力，主要用於多模態大模型及聊天機器人的學術研究。

多模態能力

結合視覺和語言處理能力，能夠理解和生成與圖像相關的文本內容。

指令跟隨

通過GPT生成的多模態指令跟隨數據微調，能夠更好地理解和執行復雜的指令。

開源

基於Apache 2.0許可證開源，方便學術研究和二次開發。

多模態指令跟隨

視覺推理

科學問答

圖像描述生成

複雜推理

學術研究

多模態大模型研究

用於研究多模態大模型的性能和能力。

視覺推理

用於研究模型在視覺推理任務上的表現。

在ScienceQA數據集上，本模型與GPT-4的協同表現刷新了該數據集的最優成績。

教育

科學問答

用於教育領域的科學問答任務。

屬性	詳情
模型類型	LLaVA是一個開源聊天機器人，通過在GPT生成的多模態指令遵循數據上微調LLaMA/Vicuna訓練而成。它是一個基於Transformer架構的自迴歸語言模型。
模型日期	LLaVA於2023年4月完成訓練。
更多信息的論文或資源	https://llava-vl.github.io/
許可證	Apache License 2.0
關於模型的問題或建議反饋處	https://github.com/haotian-liu/LLaVA/issues