G

Glm Edge V 5b

THUDMによって開発
GLM-Edge-V-5Bは50億パラメータのマルチモーダルモデルで、画像とテキスト入力をサポートし、画像理解とテキスト生成タスクを実行できます。
ダウンロード数 4,357
リリース時間 : 11/24/2024

モデル概要

このモデルはGLMアーキテクチャに基づくマルチモーダルモデルで、画像とテキスト入力を処理し、関連するテキスト出力を生成できます。画像記述、視覚的質問応答などのタスクに適しています。

モデル特徴

マルチモーダル処理能力
画像とテキスト入力を同時に処理し、関連するテキスト出力を生成できます。
大規模モデルアーキテクチャ
GLMアーキテクチャに基づき、50億パラメータを持ち、強力な理解と生成能力を備えています。
中国語サポート
中国語シーン向けに最適化されており、中国語テキストをより良く理解し生成できます。

モデル能力

画像理解
テキスト生成
画像記述
視覚的質問応答

使用事例

画像理解
画像記述
画像を入力すると、モデルは画像内容を記述するテキストを生成できます。
正確で流暢な画像記述テキストを生成します。
視覚的質問応答
画像と関連する質問を入力すると、モデルは回答を生成できます。
画像内容に関連する正確な回答を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase