G

GLM 4.1V 9B Thinking AWQ

由dengcao開發
GLM-4.1V-9B-Thinking是一款強大的視覺語言模型(VLM),專注於多模態理解和推理,通過AWQ量化版本提供高效推理能力。
下載量 882
發布時間 : 7/3/2025

模型概述

該模型基於GLM-4-9B-0414基礎模型,引入'思維範式'和強化學習,顯著提升了在複雜任務中的推理能力,支持64k上下文長度和4K圖像分辨率處理。

模型特點

強大的推理能力
通過'思維範式'和強化學習,模型在複雜任務中展現出卓越的推理能力。
長上下文支持
支持64k的上下文長度,適合處理長文檔和複雜對話。
高分辨率圖像處理
支持任意寬高比和最高4K的圖像分辨率處理。
多模態輸入
支持圖像、視頻、PDF和PPT等多種模態的輸入。

模型能力

多模態理解
複雜推理
圖像分析
視頻分析
文檔處理

使用案例

學術研究
學術基準測試
用於評估模型在多模態任務中的性能。
在18個基準任務上與甚至超過720億參數的Qwen-2.5-VL-72B。
智能體應用
GUI智能體
處理模型響應並構建用於GUI智能體用例的提示。
支持移動、桌面和Web環境的策略集成。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase