I

Instructblip Vicuna 7b

由Salesforce開發
InstructBLIP是基於BLIP-2的視覺指令調優版本,採用Vicuna-7B作為語言模型,專注於視覺語言任務。
下載量 20.99k
發布時間 : 5/22/2023

模型概述

InstructBLIP是一種通用的視覺語言模型,通過指令調優實現多模態理解與生成任務。

模型特點

視覺指令調優
通過指令調優增強模型對視覺內容的理解和響應能力
多模態處理
能夠同時處理圖像和文本輸入,生成相關文本輸出
基於Vicuna-7B
採用高性能的Vicuna-7B作為語言模型基礎

模型能力

圖像描述生成
視覺問答
多模態理解
指令跟隨

使用案例

內容理解
圖像異常檢測
識別圖像中的異常或不尋常內容
可準確描述圖像中的異常元素
輔助工具
視覺輔助
為視障人士描述圖像內容
提供詳細的圖像內容描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase