H

Heron Chat Git ELYZA Fast 7b V0

turing-motorsによって開発
入力画像に対して対話可能な視覚言語モデルで、日本語インタラクションをサポート
ダウンロード数 17
リリース時間 : 9/6/2023

モデル概要

このモデルはGITアーキテクチャを基盤とし、ELYZA日本語Llama-2 7B高速指令版言語モデルを統合、画像処理と関連テキスト記述生成や画像に関する質問への回答が可能

モデル特徴

視覚言語理解
画像内容を理解し関連対話が可能
日本語最適化
日本語に特化して訓練・最適化
多段階訓練
まずSTAIR日本語キャプションデータセットで訓練後、LLaVA日本語指令データセットと日本語Visual Genomeで微調整

モデル能力

画像説明生成
視覚質問応答
日本語対話

使用事例

チャットアプリ
画像内容質問応答
ユーザーが画像をアップロードし質問、モデルが回答生成
一般的な画像内容を正確に識別し質問に回答可能
支援ツール
画像内容説明
視覚障害者向けに画像内容を説明
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase