C

Chat Vector Llava V1.5 7b Ja

toshi456によって開発
入力画像に対して日本語で対話可能な視覚言語モデルで、Chat Vector手法を用いて複数のモデル重みを統合して作成
ダウンロード数 26
リリース時間 : 5/6/2024

モデル概要

このモデルは画像内容を理解し日本語で対話することが可能で、画像説明文生成や視覚質問応答などのタスクに適しています。

モデル特徴

日本語視覚対話
日本語に最適化された視覚言語モデルで、画像を理解し日本語で対話可能
マルチモデル統合
Chat Vector手法により複数の優れたモデルの重みを統合し、それぞれの強みを組み合わせた
マルチタスク対応
画像説明文生成、視覚質問応答など様々な視覚言語タスクをサポート

モデル能力

画像内容理解
日本語対話生成
視覚質問応答
画像説明文生成

使用事例

視覚質問応答
日本語画像質問応答
入力画像に対して質問を行い、モデルが日本語で関連する質問に回答
JA-VG-VQA-500データセットでROUGE-Lスコア18.64を達成
画像説明
日本語画像説明生成
入力画像に対して日本語の説明文を生成
Heron-Bench(詳細)タスクで53.61のスコアを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase