G

GLM 4.1V 9B Thinking

THUDMによって開発
GLM-4.1V-9B-Thinkingは、GLM-4-9B-0414ベースモデルに基づくオープンソースのビジュアル言語モデルで、複雑なタスクにおける推論能力の向上に特化しており、64kの文脈長と4Kの画像解像度をサポートします。
ダウンロード数 163
リリース時間 : 6/28/2025

モデル概要

このモデルは、ビジュアル言語モデルの推論能力の上限を探求することを目的としており、「思考パラダイム」と強化学習を導入することで、100億パラメータレベルで最先端の性能を達成し、中英語のバイリンガル使用をサポートします。

モデル特徴

強力な推論能力
思考連鎖推論パラダイムにより、回答の正確性、豊富性、説明可能性を大幅に向上させ、複雑なタスクで優れた性能を発揮します。
長文脈サポート
64kの文脈長をサポートし、長文書や多輪対話の処理に適しています。
高解像度画像処理
任意のアスペクト比で最大4Kの画像解像度をサポートし、高解像度画像を処理できます。
バイリンガルサポート
中英語のバイリンガルサポートを提供するオープンソース版で、多言語アプリケーションシナリオに適しています。

モデル能力

画像記述
複雑なタスク推論
長文脈理解
マルチモーダルエージェント

使用事例

インテリジェントシステム
複雑な問題解決
モデルの推論能力を利用して複雑なマルチモーダル問題を解決します。
18項目のベンチマークテストタスクで、720億パラメータのQwen-2.5-VL-72Bを上回りました。
長文書理解
長文書や多輪対話を処理し、64kの文脈長をサポートします。
画像分析
高解像度画像記述
高解像度画像に対して詳細な記述を行い、4K解像度をサポートします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase