G

Git Base Captioning Ft Hl Narratives

michelecafagna26によって開発
このモデルはGITアーキテクチャに基づく画像記述生成モデルで、HL Narrativesデータセットでファインチューニングされており、高レベルの物語的画像記述を生成するために特別に設計されています。
ダウンロード数 19
リリース時間 : 7/24/2023

モデル概要

このモデルは入力画像に基づいて物語性のある自然言語記述を生成でき、特に画像中の高レベルな意味やストーリー性のある内容を捉えるのに優れています。

モデル特徴

物語的記述生成
単純なオブジェクト認識だけでなく、ストーリー性と文脈認識を備えた画像記述を生成可能
高品質なファインチューニング
専門的なHL Narrativesデータセットでファインチューニングされており、生成記述の物語的品質が向上
効率的な推論
半精度(fp16)推論をサポートし、推論効率を向上

モデル能力

画像記述生成
物語的テキスト生成
視覚的コンテンツ理解

使用事例

ソーシャルメディア
自動画像記述
ソーシャルメディア画像にストーリー性のある記述を自動生成
'彼女はビーチでポーズをとって写真を撮り、ソーシャルメディアに投稿しようとしている'のような記述を生成
支援技術
視覚支援
視覚障害者により豊富な画像記述を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase