L

Llama 3 EZO VLM 1

AXCXEPTによって開発
Llama-3-8B-Instructを基にした日本語視覚言語モデル、追加の事前学習と命令チューニングにより日本語能力を強化
ダウンロード数 19
リリース時間 : 8/3/2024

モデル概要

このモデルはLlama-3-8B-Instructを基盤としており、様々なチューニング技術により汎用性能を向上させ、日本語タスクで優れたパフォーマンスを発揮すると同時に、グローバルな多様なニーズにも対応しています。

モデル特徴

強化された日本語能力
追加の事前学習と命令チューニングにより日本語処理能力を大幅に向上
マルチモーダル理解
視覚と言語能力を統合し、画像とテキスト入力を処理可能
グローバル適用性
日本語タスクに限定せず、グローバルな多様なニーズを考慮した設計

モデル能力

画像キャプション生成
視覚的質問応答
マルチターン会話
クロスモーダル理解

使用事例

インテリジェントアシスタント
画像内容質問応答
画像内容に関する様々な質問に回答
信号機の色認識などのタスクで優れた性能を発揮
コンテンツ理解
画像キャプション生成
画像に対して詳細な文章説明を生成
ベースモデルと比較して認識能力と記述能力が向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase