BakLLaVA-1開源多模態模型 - 性能超越Llama 2 13B，用途廣泛

首頁

Bakllava 1

由SkunkworksAI開發

BakLLaVA-1是基於Mistral 7B模型，並採用LLaVA 1.5架構增強的多模態模型，在多個基準測試上超越了Llama 2 13B的表現。

文本生成圖像

Transformers

英語開源協議:Apache-2.0 #多模態指令跟隨 #學術VQA增強 #Mistral-7B優化

下載量 152

發布時間 : 10/12/2023

模型概述

BakLLaVA-1是一個開源的多模態模型，結合了Mistral 7B的語言能力和LLaVA 1.5的視覺理解能力，適用於圖文理解和生成任務。

模型特點

強大的多模態能力

結合了Mistral 7B的語言模型和LLaVA 1.5的視覺理解架構，實現了優秀的圖文理解和生成能力。

超越Llama 2 13B的性能

在多個基準測試上表現優於Llama 2 13B模型。

開源可用

模型完全開源，採用Apache 2.0許可證，便於研究和開發使用。

模型能力

圖文理解

視覺問答

多模態指令跟隨

圖像描述生成

使用案例

學術研究

視覺問答系統

用於構建能夠回答關於圖像內容的問答系統

在學術VQA任務上表現良好

內容生成

自動圖像描述

為圖像生成詳細的文字描述

能夠生成準確且豐富的圖像描述

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Bakllava 1

模型概述

模型特點

模型能力

使用案例

🚀 BakLLaVA-1

🚀 快速開始

✨ 主要特性

📚 詳細文檔

評估結果

訓練數據集

📄 許可證