G

GTA1 32B

HelloKKMeによって開発
GTA1は強化学習(GRPO)に基づくGUI位置決定モデルで、成功したクリックに直接報酬を与えることで正確な位置決定を実現し、長い思考チェーン推論を避けます。
ダウンロード数 220
リリース時間 : 6/4/2025

モデル概要

このプロジェクトは強化学習アルゴリズムGRPOを利用してGUI位置決定モデルを訓練し、より正確なGUI要素の位置決定を実現することに焦点を当てています。モデルは複雑なテキスト推論に依存するのではなく、操作可能な実際の応答を直接励まし、いくつかの挑戦的なデータセットで優れた性能を発揮します。

モデル特徴

目標アライメント
強化学習(GRPOなど)は、成功したクリックに報酬を与えるという固有の目標アライメント特性を持ち、長いテキスト思考チェーン(CoT)推論を促すのではなく、正確な位置決定を実現するのに役立ちます。
直接励起
長いCoT推論に大きく依存する方法とは異なり、GRPOは操作可能で実際に基づく応答を直接励まします。
卓越した性能
いくつかの挑戦的なデータセットでベンチマークテストを行い、モデルはすべてのオープンソースモデルファミリーの中で常に最高の結果を達成します。

モデル能力

GUI要素位置決定
ビジュアル - 言語理解
多尺度画像処理

使用事例

自動化テスト
GUI要素自動クリック
自動化テストで指定されたGUI要素を自動的に位置決定してクリックします。
テストの効率と精度を向上させます。
支援技術
バリアフリーインタラクション
視覚障害者が画面上のインタラクション要素を位置決定するのを支援します。
バリアフリーユーザー体験を向上させます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase