🚀 BRIA背景去除v2.0模型卡片
BRIA背景去除v2.0是一款最先进的背景去除模型,相较于RMBG v1.4有显著提升。该模型旨在有效分离各类图像中的前景和背景。它在精心挑选的数据集上进行训练,涵盖通用库存图像、电子商务、游戏和广告内容,适用于商业用途,能大规模助力企业内容创作。其准确性、效率和通用性目前可与领先的开源模型相媲美,尤其适用于对内容安全、合法授权数据集和偏差缓解有较高要求的场景。
此模型由BRIA AI开发,以开源形式提供,仅供非商业使用。
🚀 快速开始
获取访问权限
Bria RMBG2.0可通过多种方式获取,包括源代码和权重、ComfyUI节点或API端点。
更多信息,请访问我们的网站。
加入我们的Discord社区,获取更多信息、教程、工具,并与其他用户交流!
点击此处查看演示

✨ 主要特性
- 显著提升背景去除效果,相较于RMBG v1.4有质的飞跃。
- 适用于多种图像类型和商业场景。
- 准确性、效率和通用性可与领先开源模型媲美。
- 基于合法授权数据集训练,注重内容安全和偏差缓解。
📦 安装指南
要求
torch
torchvision
pillow
kornia
transformers
💻 使用示例
基础用法
from PIL import Image
import matplotlib.pyplot as plt
import torch
from torchvision import transforms
from transformers import AutoModelForImageSegmentation
model = AutoModelForImageSegmentation.from_pretrained('briaai/RMBG-2.0', trust_remote_code=True)
torch.set_float32_matmul_precision(['high', 'highest'][0])
model.to('cuda')
model.eval()
image_size = (1024, 1024)
transform_image = transforms.Compose([
transforms.Resize(image_size),
transforms.ToTensor(),
transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
])
image = Image.open(input_image_path)
input_images = transform_image(image).unsqueeze(0).to('cuda')
with torch.no_grad():
preds = model(input_images)[-1].sigmoid().cpu()
pred = preds[0].squeeze()
pred_pil = transforms.ToPILImage()(pred)
mask = pred_pil.resize(image.size)
image.putalpha(mask)
image.save("no_bg_image.png")
📚 详细文档
模型详情
模型描述
训练数据分布
类别 |
分布 |
仅物体 |
45.11% |
人与物体/动物 |
25.24% |
仅人 |
17.35% |
人/物体/动物与文本 |
8.52% |
仅文本 |
2.52% |
仅动物 |
1.89% |
类别 |
分布 |
逼真写实 |
87.70% |
非逼真写实 |
12.30% |
类别 |
分布 |
非纯色背景 |
52.05% |
纯色背景 |
47.95% |
类别 |
分布 |
单个主要前景物体 |
51.42% |
前景中有多个物体 |
48.58% |
定性评估
开源模型比较

架构
RMBG - 2.0基于BiRefNet架构开发,并结合了我们的专有数据集和训练方案。这些训练数据显著提高了模型在背景去除任务中的准确性和有效性。
如果您在研究中使用此模型,请引用:
@article{BiRefNet,
title={Bilateral Reference for High-Resolution Dichotomous Image Segmentation},
author={Zheng, Peng and Gao, Dehong and Fan, Deng-Ping and Liu, Li and Laaksonen, Jorma and Ouyang, Wanli and Sebe, Nicu},
journal={CAAI Artificial Intelligence Research},
year={2024}
}
🔧 技术细节
RMBG - 2.0在BiRefNet架构基础上,利用专有数据集和训练方案进行优化。训练数据包含超过15,000张高质量、高分辨率、手动标注(像素级精度)且完全授权的图像,涵盖多种图像类型和场景,从而显著提高了模型在背景去除任务中的准确性和有效性。
📄 许可证
本模型遵循知识共享署名 - 非商业性使用 4.0 国际许可协议(CC BY - NC 4.0)。该模型以CC BY - NC 4.0许可证发布,仅供非商业使用。商业使用需与BRIA达成商业协议,可点击此处了解详情。购买商业许可请点击此处。