I

Internlm Xcomposer2 4khd 7b

Developed by internlm
InternLM-XComposer2-4KHDはInternLM2を基にした汎用視覚言語大モデルで、4K解像度の画像理解能力を備えています。
Downloads 1,180
Release Time : 4/7/2024

Model Overview

InternLM-XComposer2-4KHDは汎用視覚言語大モデル(VLLM)で、高解像度画像(4K)を処理し画像内容を理解でき、視覚質問応答などのタスクをサポートします。

Model Features

4K解像度画像理解
最大4K解像度の高精細画像内容の理解と分析をサポート
マルチターン視覚対話
画像に基づくマルチターン対話をサポートし、文脈を記憶して一貫したコミュニケーションが可能
高精度画像記述
詳細で正確な画像記述を生成でき、画像中の細部まで捉えることが可能

Model Capabilities

高解像度画像理解
視覚質問応答
画像内容記述
マルチターン視覚対話

Use Cases

画像分析
インフォグラフィック解釈
複雑なインフォグラフィックの内容とトレンドを分析
インフォグラフィックの各部分を正確に識別し、内容を詳細に記述できる
視覚支援
画像内容記述
視覚障害者向けに画像内容の詳細な記述を提供
正確で詳細な画像記述を生成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase