Paligemma 3b Ft Waveui 896
基于PaliGemma 3B 896分辨率权重微调的UI元素检测模型,专注于目标检测任务
Downloads 43
Release Time : 7/24/2024
Model Overview
该模型在WaveUI数据集上微调,特别擅长UI元素检测,是构建智能体计划的重要组成部分
Model Features
高精度UI元素检测
在测试集上达到0.49的平均IoU,显著优于主流闭源模型
基于WaveUI数据集优化
使用约8万条标注UI元素的数据集进行专门训练
896高分辨率支持
基于896分辨率的PaliGemma模型微调,适合高精度检测需求
Model Capabilities
UI元素检测
目标检测
视觉语言理解
Use Cases
智能体开发
UI自动化测试
自动识别和定位应用界面中的UI元素
提高测试自动化效率和准确性
智能交互代理
为智能体提供界面元素识别能力
增强智能体与图形界面的交互能力
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98