blip-base-captioning-ft-hl-narrativesオープンソースモデル - 高レベルの物語性ある画像説明を無料で生成

ホーム

Blip Base Captioning Ft Hl Narratives

michelecafagna26によって開発

HL NarrativesデータセットでファインチューニングされたBLIPモデルで、高レベルの物語的画像記述を生成するために使用されます

画像生成テキスト

Transformers

英語オープンソースライセンス:Apache-2.0 #物語的な画像記述 #高レベル意味生成 #シーンストーリー化

ダウンロード数 61

リリース時間 : 7/24/2023

モデル概要

このモデルはBLIPアーキテクチャに基づいており、HL Narrativesデータセットでファインチューニングされており、単純な物体認識ではなく、画像から物語性のある高レベルの記述を生成するために特別に設計されています。

モデル特徴

物語的記述生成

単純な物体認識ではなく、高レベルで物語性のある画像記述を生成することができます

高品質なファインチューニング

専門的な人間の物語データセット(HL Narratives)でファインチューニングされており、記述品質が向上しています

複数指標最適化

Cider、SacreBLEU、Rouge-Lなどの複数の評価指標で良好なパフォーマンスを示します

モデル能力

画像記述生成

視覚言語理解

物語的テキスト生成

使用事例

コンテンツ作成

自動画像キャプション

画像ライブラリに物語性のある記述を自動生成します

より人間的でストーリー性のある画像記述を生成します

支援技術

視覚支援

視覚障害者向けに詳細な画像記述を提供します

従来の画像記述よりも豊かなシーン理解を提供します

Cider	SacreBLEU	Rouge-L
79.39	11.70	26.17

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Blip Base Captioning Ft Hl Narratives

モデル概要

モデル特徴

モデル能力

使用事例

🚀 BLIP-base ナラティブ画像キャプショニング用にファインチューニングされたモデル

🚀 クイックスタート

モデルのファインチューニング 🏋️‍

テストセットの評価指標 🧾

モデルの実行例 🚀

📚 ドキュメント

BibTexと引用情報

📄 ライセンス