M

Mblip Bloomz 7b

由Gregor開發
mBLIP是一個多語言視覺-語言模型,基於BLIP-2架構,支持96種語言的圖像描述生成和視覺問答任務。
下載量 21
發布時間 : 9/21/2023

模型概述

mBLIP是一個高效的視覺-語言模型,由視覺變換器(ViT)、查詢變換器(Q-Former)和大型語言模型(BLOOMZ-7B)組成,支持多語言圖像理解和生成任務。

模型特點

多語言支持
支持96種語言的圖像理解和生成任務
高效對齊
通過多語言任務混合將視覺組件與多語言LLM對齊
多功能應用
支持圖像描述生成和視覺問答等多種任務
靈活部署
支持全精度、半精度和低精度(8位/4位)推理

模型能力

多語言圖像描述生成
多語言視覺問答
跨模態理解
多語言文本生成

使用案例

內容生成
多語言圖像描述
為圖像生成不同語言的描述文本
可生成96種語言的準確圖像描述
教育
多語言視覺問答
用不同語言回答關於圖像內容的問題
支持96種語言的視覺問答
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase