J

Japanese Instructblip Alpha

stabilityaiによって開発
入力画像とオプションの入力テキストに対して日本語の説明を生成できる視覚言語指示追従モデル
ダウンロード数 141
リリース時間 : 8/15/2023

モデル概要

日本指令BLIP Alpha版は、指令BLIPアーキテクチャに基づく視覚言語モデルで、日本語に最適化されており、画像とテキストプロンプトに基づいて記述的な内容を生成できます。

モデル特徴

日本語最適化
日本語に特化して最適化されており、高品質な日本語説明を生成可能
マルチモーダル入力
画像とテキスト入力を同時に処理可能で、より柔軟なインタラクションを実現
指示追従
ユーザーの指示を理解し、それに従った出力を生成可能
軽量トレーニング
Q-Former部分のみをトレーニングし、視覚エンコーダーとLLMは凍結状態を維持

モデル能力

画像説明生成
視覚的質問応答
マルチモーダル理解
日本語テキスト生成

使用事例

コンテンツ生成
画像説明生成
入力画像に対して詳細な日本語説明を生成
例えば東京スカイツリーの写真を入力すると、'桜と東京スカイツリー'を出力
支援ツール
視覚的質問応答
画像内容に関する特定の質問に回答
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase