G

GTA1 72B

Developed by HelloKKMe
GTA1は強化学習(GRPO)に基づいて訓練された最先端のGUI位置決定モデルで、長い推論ではなく直接操作可能な応答を促すことで、正確なインターフェース要素の位置決定を実現します。
Downloads 163
Release Time : 6/9/2025

Model Overview

このモデルはグラフィカルユーザーインターフェース(GUI)要素の正確な位置決定に特化しており、強化学習方法を用いて位置決定の効果を最適化し、複数のベンチマークテストで優れた性能を発揮します。

Model Features

強化学習駆動
GRPOなどの強化学習アルゴリズムを採用し、長い推論ではなく直接操作可能な応答を促します。
目標アライメント特性
成功したクリック操作に対する報酬を通じて正確な位置決定を実現し、テキスト推論チェーンに依存しません。
多サイズ対応
7B、32B、72Bの3種類のパラメータ規模のモデルを選択できます。

Model Capabilities

GUI要素位置決定
ビジョン - 言語理解
座標予測
多解像度適合

Use Cases

自動化テスト
UI要素自動クリック
自動化テストでインターフェース要素を正確に位置決定して模擬操作を行います。
ScreenSpot - V2データセットで94.8%の正確率を達成します。
支援技術
視覚障害者支援ナビゲーション
視覚障害者がインターフェース要素を位置決定して対話するのを支援します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase