G

Glm Edge V 2b

THUDMによって開発
GLM-Edge-V-2BはPytorchフレームワークに基づく画像テキストからテキストへのモデルで、中国語処理をサポートしています。
ダウンロード数 23.43k
リリース時間 : 11/24/2024

モデル概要

このモデルは主に画像とテキストを組み合わせた入力を処理し、対応するテキスト出力を生成するために使用され、マルチモーダルタスクに適しています。

モデル特徴

マルチモーダル処理
画像とテキスト入力を同時に処理し、対応するテキスト出力を生成できます。
中国語サポート
中国語テキストと画像コンテンツに特化して最適化されています。
GLMアーキテクチャに基づく
GLMアーキテクチャを採用し、効率的な推論性能を有します。

モデル能力

画像キャプション生成
マルチモーダルテキスト生成
中国語テキスト処理

使用事例

画像理解
画像キャプション生成
入力された画像に基づいて対応する文章説明を生成します。
画像内容を正確に記述するテキストを生成
マルチモーダルインタラクション
画像質問応答
画像とテキスト質問を組み合わせて回答を生成します。
画像内容に関連する正確な回答を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase