U

Uground V1 2B

Developed by osunlp
UGroundは強力なGUIビジュアル定位モデルで、簡単な方法で訓練され、OSUNLPとOrby AIが共同で開発しました。
Downloads 975
Release Time : 1/3/2025

Model Overview

UGroundはGUIビジュアル定位に特化したモデルで、画面上の特定の要素やオブジェクトを正確に定位でき、さまざまなGUIインタラクションシーンに適用できます。

Model Features

強力なGUIビジュアル定位能力
画面上の特定の要素やオブジェクトを正確に定位でき、GUI内のさまざまなコンポーネントを正確に識別します。
簡単な訓練方法
簡潔で効果的な訓練戦略を採用し、高性能なビジュアル定位能力を実現します。
多サイズ画像処理
さまざまな解像度と比率の画像を処理でき、異なるGUIインターフェースに適応します。
多言語対応
英語と中国語に加え、画像内の複数の言語のテキスト内容を理解することもサポートします。

Model Capabilities

GUI要素定位
ビジュアル質問応答
マルチモーダル理解
クロス言語テキスト認識
複雑な推論と決定

Use Cases

自動化テスト
GUI要素自動識別
アプリケーションインターフェース内のボタン、テキストボックスなどの要素を自動的に識別して定位します。
自動化テストの精度と効率を向上させます。
支援技術
ビジュアル支援ツール
視覚障害者がGUIインターフェースを理解し操作するのを支援します。
バリアフリーなアクセス体験を向上させます。
ロボット制御
ビジョンベースのロボット操作
GUIインターフェースを通じてロボットにタスクを実行させます。
より自然なロボットインタラクション方式を実現します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase