G

GLM 4.1V 9B Thinking

由 THUDM 开发
GLM-4.1V-9B-Thinking是基于GLM-4-9B-0414基础模型的开源视觉语言模型,专注于提升复杂任务中的推理能力,支持64k上下文长度和4K图像分辨率。
下载量 163
发布时间 : 6/28/2025

模型简介

该模型旨在探索视觉语言模型推理能力的上限,通过引入'思维范式'和强化学习,在100亿参数级别中达到最先进的性能,支持中英文双语使用。

模型特点

强大的推理能力
通过思维链推理范式,显著提高答案的准确性、丰富性和可解释性,在复杂任务中表现优异。
长上下文支持
支持64k上下文长度,适合处理长文档和多轮对话。
高分辨率图像处理
支持任意宽高比且最高4K图像分辨率,能够处理高清图像。
双语支持
提供中英文双语支持的开源版本,适合多语言应用场景。

模型能力

图像描述
复杂任务推理
长上下文理解
多模态智能体

使用案例

智能系统
复杂问题解决
利用模型的推理能力解决复杂的多模态问题。
在18项基准测试任务中超过720亿参数的Qwen-2.5-VL-72B。
长文档理解
处理长文档和多轮对话,支持64k上下文长度。
图像分析
高清图像描述
对高清图像进行详细描述,支持4K分辨率。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase