Hindi Image Captioning
H
Hindi Image Captioning
team-indain-image-captionによって開発
これはVITエンコーダーとGPT2-Hindiデコーダーを基に構築されたエンコーダー-デコーダー画像説明生成モデルで、ヒンディー語の画像説明を生成するために特別に設計されています。
ダウンロード数 35
リリース時間 : 3/2/2022
モデル概要
このモデルは視覚エンコーダー(ViT)と言語デコーダー(GPT2-Hindi)を組み合わせており、入力画像に対してヒンディー語の説明テキストを生成できます。ViT+GPT2-Hindiの組み合わせで画像説明生成タスクを行うのは初めての試みです。
モデル特徴
ヒンディー語画像説明
ヒンディー語に最適化された画像説明生成能力
ViT+GPT2組み合わせ
ViT視覚エンコーダーとGPT2-Hindi言語デコーダーの組み合わせアーキテクチャを初めて採用
コミュニティ駆動開発
HuggingFaceコミュニティコース週間中にコミュニティメンバーが協力して完成
モデル能力
画像理解
ヒンディー語テキスト生成
画像からテキストへの変換
使用事例
支援技術
視覚支援
視覚障害者向けにヒンディー語で画像説明を提供
コンテンツ生成
ソーシャルメディアコンテンツ
ソーシャルメディア画像に自動でヒンディー語説明を生成
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98