llava-v1.6-vicuna-13b開源多模態聊天機器人 - 免費體驗跨模態對話交互

Llava V1.6 Vicuna 13b

由liuhaotian開發

LLaVA 是一個開源的多模態聊天機器人，通過對多模態指令跟隨數據進行大型語言模型微調訓練而成。

下載量 7,080

發布時間 : 1/31/2024

模型概述

LLaVA 是基於 Transformer 架構的自迴歸語言模型，主要用於研究大型多模態模型和聊天機器人。

多模態能力

結合圖像和文本輸入，生成文本輸出。

指令跟隨

能夠理解和執行復雜的多模態指令。

開源

模型開源，可供研究和開發使用。

圖像文本理解

多模態對話

視覺問答

指令跟隨

研究

多模態模型研究

用於研究大型多模態模型的行為和性能。

教育

視覺問答系統

構建能夠回答關於圖像內容的問答系統。

屬性	詳情
模型類型	LLaVA是一個開源聊天機器人，通過在多模態指令跟隨數據上微調大語言模型（LLM）訓練而成。它是一個基於Transformer架構的自迴歸語言模型。基礎大語言模型為lmsys/vicuna-13b-v1.5
模型日期	LLaVA-v1.6-Vicuna-13B於2023年12月訓練完成。
更多信息的論文或資源	https://llava-vl.github.io/