F

Fintor GUI S2

由Fintor開發
Fintor-GUI-S2 是一個基於 UI-TARS-7B-DPO 微調的 GUI 基礎模型,專注於圖形用戶界面(GUI)的多模態任務。
下載量 190
發布時間 : 3/12/2025

模型概述

該模型是針對圖形用戶界面(GUI)優化的多模態模型,能夠理解和生成與GUI相關的文本和圖像內容。

模型特點

GUI優化
專門針對圖形用戶界面任務進行微調,在GUI相關任務上表現優異。
多模態能力
能夠同時處理圖像和文本信息,實現跨模態理解與生成。
性能提升
在Screenspot基準測試上相比基礎模型有顯著性能提升。

模型能力

GUI圖像理解
跨模態文本生成
GUI元素識別
多模態推理

使用案例

GUI自動化
GUI元素描述生成
根據GUI截圖生成界面元素的描述文本
在Screenspot v2基準上達到91.8的準確率
GUI操作指導
根據GUI圖像生成操作步驟說明
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase