H

Heron Chat Git Ja Stablelm Base 7b V0

turing-motorsによって開発
Heron GIT Japanese StableLM Base 7B は入力画像について対話可能な視覚言語モデルです。
ダウンロード数 57
リリース時間 : 9/6/2023

モデル概要

このモデルは視覚言語モデルで、入力画像に基づいて対話が可能であり、主に日本語環境における画像理解と質問応答タスクに使用されます。

モデル特徴

日本語視覚言語理解
日本語環境に特化して最適化された視覚言語モデルで、画像内容を理解し日本語で説明や質問応答が可能です。
2段階トレーニング
最初にSTAIR Captionsで事前学習し、その後LLaVA-Instruct-150K-JAとJapanese Visual Genomeでファインチューニングを行います。
StableLMベース
Japanese StableLM Base Alphaを言語モデル基盤として使用し、優れた日本語理解・生成能力を備えています。

モデル能力

画像キャプション生成
視覚的質問応答
日本語対話
画像内容理解

使用事例

チャットアプリケーション
画像対話ボット
ユーザーが画像をアップロードすると、モデルは画像内容について対話や質問応答が可能です。
画像内容に関連した日本語回答を生成できます。
研究
視覚言語モデル研究
日本語環境における視覚言語理解の研究や実験に使用可能です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase