I

Instructblip Flan T5 Xl 8bit Nf4

由Mediocreatmybest開發
InstructBLIP是基於BLIP-2的視覺指令調優模型,使用Flan-T5-xl作為語言模型,能夠根據圖像和文本指令生成描述。
下載量 22
發布時間 : 8/21/2023

模型概述

InstructBLIP是一個視覺-語言模型,通過指令調優增強了BLIP-2的能力,能夠根據圖像和文本提示生成準確的描述或回答相關問題。

模型特點

視覺指令調優
通過指令調優增強了模型對視覺任務的理解和響應能力
8位量化支持
支持使用bitsandbytes進行8位和nf4量化,降低資源需求
Safetensors格式
模型權重以更安全的Safetensors格式提供

模型能力

圖像描述生成
視覺問答
多模態理解
指令跟隨

使用案例

圖像理解
圖像內容描述
對圖像內容生成詳細描述
能準確識別圖像中的物體、場景和關係
視覺問答
回答關於圖像內容的特定問題
能理解問題並基於圖像內容提供準確回答
輔助功能
視覺輔助
為視障人士描述圖像內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase