H

Hindi Image Captioning

team-indain-image-captionによって開発
これはVITエンコーダーとGPT2-Hindiデコーダーを基に構築されたエンコーダー-デコーダー画像説明生成モデルで、ヒンディー語の画像説明を生成するために特別に設計されています。
ダウンロード数 35
リリース時間 : 3/2/2022

モデル概要

このモデルは視覚エンコーダー(ViT)と言語デコーダー(GPT2-Hindi)を組み合わせており、入力画像に対してヒンディー語の説明テキストを生成できます。ViT+GPT2-Hindiの組み合わせで画像説明生成タスクを行うのは初めての試みです。

モデル特徴

ヒンディー語画像説明
ヒンディー語に最適化された画像説明生成能力
ViT+GPT2組み合わせ
ViT視覚エンコーダーとGPT2-Hindi言語デコーダーの組み合わせアーキテクチャを初めて採用
コミュニティ駆動開発
HuggingFaceコミュニティコース週間中にコミュニティメンバーが協力して完成

モデル能力

画像理解
ヒンディー語テキスト生成
画像からテキストへの変換

使用事例

支援技術
視覚支援
視覚障害者向けにヒンディー語で画像説明を提供
コンテンツ生成
ソーシャルメディアコンテンツ
ソーシャルメディア画像に自動でヒンディー語説明を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase