F

Ferret UI Gemma2b

由jadechoghari開發
Ferret-UI是首個專注於用戶界面的多模態大語言模型,基於Gemma-2B構建,專為UI引用、定位和推理任務設計。
下載量 302
發布時間 : 10/9/2024

模型概述

Ferret-UI是一個多模態大語言模型,專注於用戶界面(UI)的理解和分析,能夠執行復雜的UI任務,如引用、定位和推理。

模型特點

UI專用多模態模型
首個專注於用戶界面理解的多模態大語言模型
精準定位能力
能夠精確定位UI元素並提供邊界框座標
複雜推理能力
可執行復雜的UI相關推理任務

模型能力

UI元素識別
UI元素定位
UI界面描述
UI元素交互分析
UI佈局理解

使用案例

移動應用界面分析
應用界面元素識別
識別並描述移動應用界面中的各種元素
準確識別按鈕、文本區域等UI組件
界面導航分析
分析應用界面的導航結構和流程
理解界面間的跳轉關係和用戶操作路徑
UI自動化測試
UI元素驗證
驗證UI元素的存在和位置
確保界面元素按設計規範呈現
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase