B

Blip Base Captioning Ft Hl Actions

由 michelecafagna26 开发
该模型是基于BLIP架构微调的图像到文本生成模型,专门用于生成描述图像中高层动作的标题。
下载量 16
发布时间 : 7/22/2023

模型简介

该模型在HL数据集上进行了微调,专注于从图像生成描述动作的自然语言文本。

模型特点

高层动作描述
专门针对图像中的高层动作生成描述性文本
微调优化
在HL数据集上进行了6轮微调,优化了动作描述能力
半精度训练
使用fp16半精度进行训练,提高训练效率

模型能力

图像理解
动作描述生成
自然语言生成

使用案例

图像描述
动作场景描述
为包含人物动作的图像生成描述性文本
生成如'她正撑着一把伞'等自然语言描述
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase