G

GTA1 32B

由HelloKKMe開發
GTA1是一個基於強化學習(GRPO)的GUI定位模型,通過直接獎勵成功點擊來實現精準定位,避免冗長的思維鏈推理。
下載量 220
發布時間 : 6/4/2025

模型概述

該項目利用強化學習算法GRPO訓練GUI定位模型,專注於實現更精準的GUI元素定位。模型通過直接激勵可操作的實際響應,而非依賴複雜的文本推理,在多個挑戰性數據集上表現出色。

模型特點

目標對齊
強化學習(如GRPO)因其固有的目標對齊特性,即獎勵成功點擊,而非鼓勵冗長的文本思維鏈(CoT)推理,有助於實現精準定位。
直接激勵
與嚴重依賴冗長CoT推理的方法不同,GRPO直接激勵可操作且基於實際的響應。
性能卓越
在多個挑戰性數據集上進行基準測試,模型在所有開源模型家族中始終取得最佳結果。

模型能力

GUI元素定位
視覺-語言理解
多尺度圖像處理

使用案例

自動化測試
GUI元素自動點擊
在自動化測試中自動定位並點擊指定的GUI元素
提高測試效率和準確性
輔助技術
無障礙交互
幫助視障用戶定位屏幕上的交互元素
提升無障礙用戶體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase