G

GLM 4.1V 9B Thinking AWQ

由 dengcao 开发
GLM-4.1V-9B-Thinking是一款强大的视觉语言模型(VLM),专注于多模态理解和推理,通过AWQ量化版本提供高效推理能力。
下载量 882
发布时间 : 7/3/2025

模型简介

该模型基于GLM-4-9B-0414基础模型,引入'思维范式'和强化学习,显著提升了在复杂任务中的推理能力,支持64k上下文长度和4K图像分辨率处理。

模型特点

强大的推理能力
通过'思维范式'和强化学习,模型在复杂任务中展现出卓越的推理能力。
长上下文支持
支持64k的上下文长度,适合处理长文档和复杂对话。
高分辨率图像处理
支持任意宽高比和最高4K的图像分辨率处理。
多模态输入
支持图像、视频、PDF和PPT等多种模态的输入。

模型能力

多模态理解
复杂推理
图像分析
视频分析
文档处理

使用案例

学术研究
学术基准测试
用于评估模型在多模态任务中的性能。
在18个基准任务上与甚至超过720亿参数的Qwen-2.5-VL-72B。
智能体应用
GUI智能体
处理模型响应并构建用于GUI智能体用例的提示。
支持移动、桌面和Web环境的策略集成。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase