B

Bakllava 1

由SkunkworksAI開發
BakLLaVA-1是基於Mistral 7B模型,並採用LLaVA 1.5架構增強的多模態模型,在多個基準測試上超越了Llama 2 13B的表現。
下載量 152
發布時間 : 10/12/2023

模型概述

BakLLaVA-1是一個開源的多模態模型,結合了Mistral 7B的語言能力和LLaVA 1.5的視覺理解能力,適用於圖文理解和生成任務。

模型特點

強大的多模態能力
結合了Mistral 7B的語言模型和LLaVA 1.5的視覺理解架構,實現了優秀的圖文理解和生成能力。
超越Llama 2 13B的性能
在多個基準測試上表現優於Llama 2 13B模型。
開源可用
模型完全開源,採用Apache 2.0許可證,便於研究和開發使用。

模型能力

圖文理解
視覺問答
多模態指令跟隨
圖像描述生成

使用案例

學術研究
視覺問答系統
用於構建能夠回答關於圖像內容的問答系統
在學術VQA任務上表現良好
內容生成
自動圖像描述
為圖像生成詳細的文字描述
能夠生成準確且豐富的圖像描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase