I

Instructblip Flan T5 Xxl 8bit Nf4

由Mediocreatmybest開發
InstructBLIP是BLIP-2的視覺指令調優版本,結合了視覺和語言模型,能夠根據圖像和文本指令生成描述或回答問題。
下載量 22
發布時間 : 8/21/2023

模型概述

該模型採用Flan-T5-xxl作為語言模型,通過指令調優實現通用的視覺-語言任務處理能力。

模型特點

視覺指令調優
通過指令調優使模型能夠理解和執行基於圖像的複雜指令
多模態處理
同時處理視覺和語言輸入,實現跨模態理解
8位量化支持
支持使用bitsandbytes進行8位/nf4量化,降低資源需求

模型能力

圖像描述生成
視覺問答
跨模態理解
指令跟隨

使用案例

圖像理解
圖像異常檢測
識別並描述圖像中的不尋常之處
可準確指出圖像中的異常元素
輔助功能
視覺輔助
為視障人士描述圖像內容
生成詳細準確的圖像描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase