G

GTA1 32B

由 HelloKKMe 开发
GTA1是一个基于强化学习(GRPO)的GUI定位模型,通过直接奖励成功点击来实现精准定位,避免冗长的思维链推理。
下载量 220
发布时间 : 6/4/2025

模型简介

该项目利用强化学习算法GRPO训练GUI定位模型,专注于实现更精准的GUI元素定位。模型通过直接激励可操作的实际响应,而非依赖复杂的文本推理,在多个挑战性数据集上表现出色。

模型特点

目标对齐
强化学习(如GRPO)因其固有的目标对齐特性,即奖励成功点击,而非鼓励冗长的文本思维链(CoT)推理,有助于实现精准定位。
直接激励
与严重依赖冗长CoT推理的方法不同,GRPO直接激励可操作且基于实际的响应。
性能卓越
在多个挑战性数据集上进行基准测试,模型在所有开源模型家族中始终取得最佳结果。

模型能力

GUI元素定位
视觉-语言理解
多尺度图像处理

使用案例

自动化测试
GUI元素自动点击
在自动化测试中自动定位并点击指定的GUI元素
提高测试效率和准确性
辅助技术
无障碍交互
帮助视障用户定位屏幕上的交互元素
提升无障碍用户体验
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase