Q

Qhub Blip Image Captioning Finetuned

由quadranttechnologies開發
針對零售產品圖像視覺問答任務微調後的BLIP模型版本,基於在線零售平臺的圖像和產品描述標註的自定義數據集進行了微調。
下載量 369
發布時間 : 11/7/2024

模型概述

該模型用於零售行業中對產品圖像進行問答,支持產品元數據增強、人工生成產品描述的驗證等應用場景。

模型特點

零售場景優化
針對零售產品圖像進行了專門微調,能準確識別和描述各類商品
多模態理解
結合視覺和語言信息,實現圖像到文本的轉換
條件式生成
支持基於提示文本的條件式圖像描述生成

模型能力

圖像描述生成
產品識別
視覺問答
零售場景理解

使用案例

電子商務
產品元數據增強
自動為電商平臺上的產品圖像生成描述性文本
如準確識別並描述'凱膳怡專業立式攪拌機'等產品
產品描述驗證
驗證人工編寫的產品描述是否與圖像內容匹配
零售分析
貨架商品識別
識別零售貨架上的商品並生成描述
如準確識別'布什牌白豆罐頭'等商品
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase