S

Sapiens Seg 1b Bfloat16

由 facebook 开发
Sapiens是基于3亿张高分辨率人类图像预训练的视觉Transformer模型,专注于以人为中心的视觉任务
下载量 42
发布时间 : 9/10/2024

模型简介

该模型用于对人类图像进行28类身体部位分割,支持1K高分辨率推理,在真实场景中展现出卓越的泛化能力

模型特点

高分辨率支持
原生支持1024x1024分辨率输入,适合高精度分割任务
大规模预训练
基于3亿张人类图像预训练,学习丰富的视觉特征
真实场景泛化
即使在标注数据稀缺或完全合成的情况下,也能对真实数据保持良好性能
高效推理
采用bfloat16格式优化,平衡精度与计算效率

模型能力

人体部位分割
高分辨率图像处理
多类别语义分割

使用案例

医疗影像
手术规划辅助
用于术前对人体解剖结构的精确分割
提供28类身体部位的精确分割结果
虚拟现实
虚拟形象创建
用于生成高保真虚拟人物的身体部位分割
支持真实感虚拟形象的身体部位识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase