🚀 BRIA Background Removal v2.0 モデルカード
RMBG v2.0は、当社の最新の背景除去モデルで、RMBG v1.4を大幅に改善しています。このモデルは、さまざまなカテゴリや画像タイプで前景と背景を効果的に分離するように設計されています。このモデルは、一般的なストック画像、電子商取引、ゲーム、広告コンテンツなど、慎重に選択されたデータセットで学習されており、エンタープライズのコンテンツ作成を大規模でサポートする商用ユースケースに適しています。現在、その精度、効率、汎用性は、主要なソースオープンモデルに匹敵しています。コンテンツの安全性、法的にライセンスされたデータセット、バイアスの軽減が重要な場面で最適です。
BRIA AIによって開発されたRMBG v2.0は、非商用利用のためのソースオープンモデルとして提供されています。
アクセス方法
Bria RMBG2.0は、ソースコードと重み、ComfyUIノード、またはAPIエンドポイントとして、あらゆる場所で利用できます。
詳細については、当社のウェブサイトをご覧ください。
より詳しい情報、チュートリアル、ツール、および他のユーザーとの交流のために、Discordコミュニティに参加してください!
デモを見るにはここをクリック

📚 ドキュメント
モデルの詳細
学習データ
Bria-RMBGモデルは、15,000以上の高品質、高解像度、手動でラベル付けされた(ピクセル単位の精度)、完全にライセンスされた画像で学習されています。ベンチマークには、バランスの取れた性別、民族、およびさまざまな障害を持つ人々が含まれています。明確にするために、異なるカテゴリによるデータ分布を提供しており、このモデルの汎用性を示しています。
カテゴリ |
分布 |
オブジェクトのみ |
45.11% |
オブジェクト/動物と一緒の人物 |
25.24% |
人物のみ |
17.35% |
テキスト付きの人物/オブジェクト/動物 |
8.52% |
テキストのみ |
2.52% |
動物のみ |
1.89% |
カテゴリ |
分布 |
写実的 |
87.70% |
非写実的 |
12.30% |
カテゴリ |
分布 |
非単色背景 |
52.05% |
単色背景 |
47.95% |
カテゴリ |
分布 |
単一の主要な前景オブジェクト |
51.42% |
前景に複数のオブジェクト |
48.58% |
定性的評価
オープンソースモデルとの比較

アーキテクチャ
RMBG-2.0は、BiRefNetアーキテクチャをベースに、独自のデータセットと学習スキームで強化されています。この学習データは、背景除去タスクにおけるモデルの精度と有効性を大幅に向上させています。
もしこのモデルを研究で使用する場合は、以下を引用してください。
@article{BiRefNet,
title={Bilateral Reference for High-Resolution Dichotomous Image Segmentation},
author={Zheng, Peng and Gao, Dehong and Fan, Deng-Ping and Liu, Li and Laaksonen, Jorma and Ouyang, Wanli and Sebe, Nicu},
journal={CAAI Artificial Intelligence Research},
year={2024}
}
必要条件
torch
torchvision
pillow
kornia
transformers
💻 使用例
基本的な使用法
from PIL import Image
import matplotlib.pyplot as plt
import torch
from torchvision import transforms
from transformers import AutoModelForImageSegmentation
model = AutoModelForImageSegmentation.from_pretrained('briaai/RMBG-2.0', trust_remote_code=True)
torch.set_float32_matmul_precision(['high', 'highest'][0])
model.to('cuda')
model.eval()
image_size = (1024, 1024)
transform_image = transforms.Compose([
transforms.Resize(image_size),
transforms.ToTensor(),
transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
])
image = Image.open(input_image_path)
input_images = transform_image(image).unsqueeze(0).to('cuda')
with torch.no_grad():
preds = model(input_images)[-1].sigmoid().cpu()
pred = preds[0].squeeze()
pred_pil = transforms.ToPILImage()(pred)
mask = pred_pil.resize(image.size)
image.putalpha(mask)
image.save("no_bg_image.png")
📄 ライセンス
このモデルは、非商用利用のためにCreative Commons Attribution–Non-Commercial (CC BY-NC 4.0)ライセンスの下で提供されています。商用利用については、こちらを参照してください。