I

Instructblip Vicuna 7b

Salesforceによって開発
InstructBLIPはBLIP-2をベースにした視覚的指示チューニング版で、Vicuna-7Bを言語モデルとして採用し、視覚言語タスクに特化しています。
ダウンロード数 20.99k
リリース時間 : 5/22/2023

モデル概要

InstructBLIPは汎用的な視覚言語モデルで、指示チューニングによりマルチモーダル理解と生成タスクを実現します。

モデル特徴

視覚的指示チューニング
指示チューニングにより、モデルの視覚内容理解と応答能力を強化
マルチモーダル処理
画像とテキスト入力を同時に処理し、関連するテキスト出力を生成可能
Vicuna-7Bベース
高性能なVicuna-7Bを言語モデル基盤として採用

モデル能力

画像キャプション生成
視覚的質問応答
マルチモーダル理解
指示追従

使用事例

コンテンツ理解
画像異常検出
画像内の異常や通常と異なる内容を識別
画像中の異常要素を正確に記述可能
支援ツール
視覚支援
視覚障害者のために画像内容を説明
詳細な画像内容説明を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase