Git Base Captioning Ft Hl Narratives
G
Git Base Captioning Ft Hl Narratives
michelecafagna26によって開発
このモデルはGITアーキテクチャに基づく画像記述生成モデルで、HL Narrativesデータセットでファインチューニングされており、高レベルの物語的画像記述を生成するために特別に設計されています。
ダウンロード数 19
リリース時間 : 7/24/2023
モデル概要
このモデルは入力画像に基づいて物語性のある自然言語記述を生成でき、特に画像中の高レベルな意味やストーリー性のある内容を捉えるのに優れています。
モデル特徴
物語的記述生成
単純なオブジェクト認識だけでなく、ストーリー性と文脈認識を備えた画像記述を生成可能
高品質なファインチューニング
専門的なHL Narrativesデータセットでファインチューニングされており、生成記述の物語的品質が向上
効率的な推論
半精度(fp16)推論をサポートし、推論効率を向上
モデル能力
画像記述生成
物語的テキスト生成
視覚的コンテンツ理解
使用事例
ソーシャルメディア
自動画像記述
ソーシャルメディア画像にストーリー性のある記述を自動生成
'彼女はビーチでポーズをとって写真を撮り、ソーシャルメディアに投稿しようとしている'のような記述を生成
支援技術
視覚支援
視覚障害者により豊富な画像記述を提供
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98