A

Asagi 4B

MIL-UTによって開発
Asagi-4Bは大規模な日本語視覚言語モデル(VLM)で、広範な日本語データセットに基づいて訓練され、多様なデータソースを統合しています。
ダウンロード数 29
リリース時間 : 1/27/2025

モデル概要

このモデルは日本語視覚言語モデルで、画像に関連する日本語テキストを理解し生成することができ、画像理解と生成タスクに適しています。

モデル特徴

日本語視覚言語モデル
日本語に特化して最適化された視覚言語モデルで、画像に関連する日本語テキストを理解し生成できます。
多様な訓練データ
合成データや翻訳データを含む複数のデータソースを統合し、幅広い日本語アプリケーションシーンをカバーしています。
高性能
複数の評価ベンチマークで優れた性能を示し、特に日本語視覚言語タスクにおいて顕著です。

モデル能力

画像理解
日本語テキスト生成
視覚質問応答
画像記述生成

使用事例

視覚質問応答
画像内容質問応答
画像の撮影場所や内容説明など、画像内容に関する詳細な質問に答えます。
詳細かつ具体的な回答を生成し、画像内容を正確に記述できます。
画像記述生成
画像内容記述
シーン、物体、背景などを含む画像の詳細な記述を生成します。
生成される自然言語記述は正確で詳細であり、画像内容に合致しています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase