BLIPオープンソース画像テキスト変換モデル - ファッション写真で訓練され、無料で正確な画像説明を生成

ホーム

Blip Image Captioning Base Fashionimages Finetuned

alesanmによって開発

このBLIPモデルは141枚のバレンシアガファッションブランド写真とGPT3で生成された説明文でトレーニングされ、画像からテキストへの変換タスクに特化しています。

画像生成テキスト

Transformers

#ファッションブランド画像説明 #GPT3補助トレーニング #少数サンプル画像からテキストへ

ダウンロード数 86

リリース時間 : 7/24/2023

モデル概要

BLIPアーキテクチャに基づく画像からテキストへのモデルで、バレンシアガファッションブランドの写真に特化した記述テキストを生成します。

モデル特徴

ファッションブランド特化

バレンシアガブランド写真に最適化され、より正確なファッション関連の記述を生成可能

GPT3強化トレーニング

GPT3生成の説明文を使用してトレーニングし、テキスト生成品質を向上

軽量データセット

141枚の厳選写真でトレーニングされ、特定領域のアプリケーションに適しています

モデル能力

画像説明生成

ファッション製品分析

マルチモーダル理解

使用事例

Eコマース

製品自動タグ付け

ECプラットフォームのバレンシアガ製品に自動的に説明テキストを生成

手動タグ付けコスト削減、出品効率向上

ファッション分析

デザイン要素識別

バレンシアガ衣類のデザイン特徴やスタイル要素を識別・記述

ファッショントレンド分析やデザイン研究を支援

プロパティ	詳細
推論	False
データセット	alesanm/balenciaga_short_descriptions
ライブラリ名	transformers
パイプラインタグ	image-to-text

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Blip Image Captioning Base Fashionimages Finetuned

モデル概要

モデル特徴

モデル能力

使用事例

🚀 BLIPモデル

🚀 クイックスタート

📚 ドキュメント