G

GLM 4.1V 9B Thinking AWQ

dengcaoによって開発
GLM-4.1V-9B-Thinkingは、マルチモーダル理解と推論に特化した強力なビジュアル言語モデル(VLM)で、AWQ量子化バージョンにより効率的な推論能力を提供します。
ダウンロード数 882
リリース時間 : 7/3/2025

モデル概要

このモデルはGLM-4-9B-0414ベースモデルに基づき、「思考パラダイム」と強化学習を導入することで、複雑なタスクにおける推論能力を大幅に向上させ、64kのコンテキスト長と4K画像解像度の処理をサポートします。

モデル特徴

強力な推論能力
「思考パラダイム」と強化学習により、モデルは複雑なタスクにおいて卓越した推論能力を発揮します。
長コンテキストサポート
64kのコンテキスト長をサポートし、長い文書や複雑な対話の処理に適しています。
高解像度画像処理
任意のアスペクト比と最高4Kの画像解像度の処理をサポートします。
マルチモーダル入力
画像、動画、PDF、PPTなどの複数のモーダルの入力をサポートします。

モデル能力

マルチモーダル理解
複雑な推論
画像分析
動画分析
文書処理

使用事例

学術研究
学術ベンチマークテスト
マルチモーダルタスクにおけるモデルの性能を評価するために使用されます。
18のベンチマークタスクで、720億パラメータのQwen-2.5-VL-72Bと同等またはそれ以上の性能を発揮します。
エージェントアプリケーション
GUIエージェント
モデルの応答を処理し、GUIエージェントのユースケース用のプロンプトを構築します。
モバイル、デスクトップ、Web環境のポリシー統合をサポートします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase