U

UI TARS 2B SFT

由bytedance-research開發
UI-TARS是新一代原生圖形用戶界面(GUI)代理模型,旨在通過類人的感知、推理和行動能力與圖形用戶界面無縫交互。
下載量 5,792
發布時間 : 1/20/2025

模型概述

UI-TARS將所有關鍵組件——感知、推理、定位和記憶——集成在一個單一的視覺語言模型(VLM)中,實現了無需預定義工作流程或手動規則的端到端任務自動化。

模型特點

端到端任務自動化
集成感知、推理、定位和記憶於單一模型,無需預定義工作流程或手動規則。
原生GUI交互
通過類人的感知、推理和行動能力與圖形用戶界面無縫交互。
多模態能力
結合視覺和語言理解能力,處理複雜的GUI任務。

模型能力

圖形用戶界面交互
視覺語言理解
端到端任務自動化
多模態推理

使用案例

自動化測試
GUI自動化測試
自動執行GUI界面的測試任務,無需人工干預。
提高測試效率和覆蓋率
智能助手
GUI操作助手
幫助用戶完成複雜的GUI操作任務。
提升用戶操作效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase