GLM-Edge-V-5Bオープンソースマルチモーダルモデル - 画像とテキスト入力をサポートし、理解と生成タスクを実行

ホーム

Glm Edge V 5b

THUDMによって開発

GLM-Edge-V-5Bは50億パラメータのマルチモーダルモデルで、画像とテキスト入力をサポートし、画像理解とテキスト生成タスクを実行できます。

画像生成テキスト

Safetensors

オープンソースライセンス:その他 #画像テキスト記述 #マルチモーダル対話 #中国語最適化

ダウンロード数 4,357

リリース時間 : 11/24/2024

モデル概要

このモデルはGLMアーキテクチャに基づくマルチモーダルモデルで、画像とテキスト入力を処理し、関連するテキスト出力を生成できます。画像記述、視覚的質問応答などのタスクに適しています。

モデル特徴

マルチモーダル処理能力

画像とテキスト入力を同時に処理し、関連するテキスト出力を生成できます。

大規模モデルアーキテクチャ

GLMアーキテクチャに基づき、50億パラメータを持ち、強力な理解と生成能力を備えています。

中国語サポート

中国語シーン向けに最適化されており、中国語テキストをより良く理解し生成できます。

モデル能力

画像理解

テキスト生成

画像記述

視覚的質問応答

使用事例

画像理解

画像記述

画像を入力すると、モデルは画像内容を記述するテキストを生成できます。

正確で流暢な画像記述テキストを生成します。

視覚的質問応答

画像と関連する質問を入力すると、モデルは回答を生成できます。

画像内容に関連する正確な回答を生成します。

属性	详情
フレームワーク	Pytorch
パイプラインタグ	image-text-to-text
タグ	glm, edge
推論	false
ライセンス	other
ライセンス名	glm-4
ライセンスリンク	LICENSE

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Glm Edge V 5b

モデル概要

モデル特徴

モデル能力

使用事例

🚀 GLM-Edge-V-5B

🚀 クイックスタート

📦 インストール

💻 使用例

基本的な使用法

📄 ライセンス