G

GTA1 72B

由 HelloKKMe 开发
GTA1是基于强化学习(GRPO)训练的最先进GUI定位模型,通过直接激励可操作响应而非冗长推理,实现精准界面元素定位。
下载量 163
发布时间 : 6/9/2025

模型简介

该模型专注于图形用户界面(GUI)元素的精确定位,采用强化学习方法优化定位效果,在多个基准测试中表现优异。

模型特点

强化学习驱动
采用GRPO等强化学习算法,直接激励可操作响应而非冗长推理
目标对齐特性
通过奖励成功的点击操作实现精准定位,而非依赖文本推理链
多尺寸支持
提供7B、32B和72B三种参数规模的模型选择

模型能力

GUI元素定位
视觉-语言理解
坐标预测
多分辨率适配

使用案例

自动化测试
UI元素自动化点击
在自动化测试中精确定位界面元素进行模拟操作
在ScreenSpot-V2数据集达到94.8%准确率
辅助技术
视障辅助导航
帮助视障用户定位界面元素进行交互
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase