B

Blip Base Captioning Ft Hl Actions

由michelecafagna26開發
該模型是基於BLIP架構微調的圖像到文本生成模型,專門用於生成描述圖像中高層動作的標題。
下載量 16
發布時間 : 7/22/2023

模型概述

該模型在HL數據集上進行了微調,專注於從圖像生成描述動作的自然語言文本。

模型特點

高層動作描述
專門針對圖像中的高層動作生成描述性文本
微調優化
在HL數據集上進行了6輪微調,優化了動作描述能力
半精度訓練
使用fp16半精度進行訓練,提高訓練效率

模型能力

圖像理解
動作描述生成
自然語言生成

使用案例

圖像描述
動作場景描述
為包含人物動作的圖像生成描述性文本
生成如'她正撐著一把傘'等自然語言描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase