L

Llava V1.6 Vicuna 13b

由liuhaotian開發
LLaVA 是一個開源的多模態聊天機器人,通過對多模態指令跟隨數據進行大型語言模型微調訓練而成。
下載量 7,080
發布時間 : 1/31/2024

模型概述

LLaVA 是基於 Transformer 架構的自迴歸語言模型,主要用於研究大型多模態模型和聊天機器人。

模型特點

多模態能力
結合圖像和文本輸入,生成文本輸出。
指令跟隨
能夠理解和執行復雜的多模態指令。
開源
模型開源,可供研究和開發使用。

模型能力

圖像文本理解
多模態對話
視覺問答
指令跟隨

使用案例

研究
多模態模型研究
用於研究大型多模態模型的行為和性能。
教育
視覺問答系統
構建能夠回答關於圖像內容的問答系統。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase