H

Hindi Image Captioning

由 team-indain-image-caption 开发
这是一个基于VIT编码器和GPT2-Hindi解码器构建的编码器-解码器图像描述生成模型,专门用于生成印地语图像描述。
下载量 35
发布时间 : 3/2/2022

模型简介

该模型结合了视觉编码器(ViT)和语言解码器(GPT2-Hindi),能够为输入的图像生成印地语描述文本。这是首次尝试使用ViT+GPT2-Hindi组合来完成图像描述生成任务。

模型特点

印地语图像描述
专门针对印地语优化的图像描述生成能力
ViT+GPT2组合
首次尝试使用ViT视觉编码器和GPT2-Hindi语言解码器的组合架构
社区驱动开发
在HuggingFace社区课程周期间由社区成员合作完成

模型能力

图像理解
印地语文本生成
图像到文本转换

使用案例

辅助技术
视觉辅助
为视障人士提供印地语图像描述
内容生成
社交媒体内容
自动为社交媒体图片生成印地语描述
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase