🚀 BRIA Background Removal v2.0 モデルカード
RMBG v2.0は、最新技術の背景除去モデルで、RMBG v1.4を大幅に改善しています。このモデルは、さまざまなカテゴリと画像タイプで前景と背景を効果的に分離するように設計されています。このモデルは、一般的なストック画像、電子商取引、ゲーム、広告コンテンツなどを含む、慎重に選択されたデータセットで学習されており、エンタープライズのコンテンツ作成を大規模にサポートする商用ユースケースに適しています。現在、その精度、効率、汎用性は、主要なソースオープンモデルに匹敵しています。コンテンツの安全性、法的にライセンスされたデータセット、バイアスの軽減が重要な場面に最適です。
BRIA AIによって開発されたRMBG v2.0は、非商用利用のためのソースオープンモデルとして利用可能です。
アクセス方法
Bria RMBG2.0は、ソースコードと重み、ComfyUIノード、またはAPIエンドポイントとして、あなたが構築するあらゆる場所で利用可能です。
詳細については、ウェブサイトをご覧ください。
より詳しい情報、チュートリアル、ツール、および他のユーザーとのコミュニケーションについては、Discordコミュニティに参加してください!
デモを見るにはここをクリック

📚 詳細ドキュメント
モデルの説明
属性 |
详情 |
開発元 |
BRIA AI |
モデルタイプ |
背景除去 |
ライセンス |
Creative Commons Attribution–Non-Commercial (CC BY-NC 4.0)。このモデルは非商用利用のためにCC BY-NC 4.0ライセンスの下で公開されています。商用利用については、BRIAとの商用契約が必要です。こちらから詳細を確認できます。 |
モデルの説明 |
BRIA RMBG-2.0は、専門グレードのデータセットでのみ学習された二値画像セグメンテーションモデルです。モデルの出力には、単一チャンネルの8ビットグレースケールアルファマットが含まれ、各ピクセル値は元の画像の対応するピクセルの不透明度レベルを示します。この非二値出力アプローチにより、開発者は前景と背景の分離にカスタム閾値を定義することができ、さまざまなユースケースの要件に対応し、複雑なパイプラインへの統合を強化します。 |
BRIAについて |
詳細な情報については、BRIA AIを参照してください。 |
学習データ
Bria-RMBGモデルは、15,000以上の高品質、高解像度、手動でラベル付けされた(ピクセル単位の精度)、完全にライセンスされた画像を使用して学習されています。ベンチマークには、バランスの取れた性別、民族、およびさまざまな障害を持つ人々が含まれています。明確化のために、さまざまなカテゴリによるデータ分布を提供しており、これはモデルの汎用性を示しています。
画像の分布
カテゴリ |
分布 |
オブジェクトのみ |
45.11% |
オブジェクト/動物を伴う人物 |
25.24% |
人物のみ |
17.35% |
テキストを伴う人物/オブジェクト/動物 |
8.52% |
テキストのみ |
2.52% |
動物のみ |
1.89% |
カテゴリ |
分布 |
写実的 |
87.70% |
非写実的 |
12.30% |
カテゴリ |
分布 |
非単色背景 |
52.05% |
単色背景 |
47.95% |
カテゴリ |
分布 |
単一の主要な前景オブジェクト |
51.42% |
前景に複数のオブジェクト |
48.58% |
定性評価
オープンソースモデルの比較

アーキテクチャ
RMBG-2.0は、BiRefNetアーキテクチャを基に、独自のデータセットと学習スキームを用いて開発されています。この学習データにより、背景除去タスクにおけるモデルの精度と有効性が大幅に向上しています。
このモデルを研究で使用する場合は、以下を引用してください。
@article{BiRefNet,
title={Bilateral Reference for High-Resolution Dichotomous Image Segmentation},
author={Zheng, Peng and Gao, Dehong and Fan, Deng-Ping and Liu, Li and Laaksonen, Jorma and Ouyang, Wanli and Sebe, Nicu},
journal={CAAI Artificial Intelligence Research},
year={2024}
}
必要条件
torch
torchvision
pillow
kornia
transformers
💻 使用例
基本的な使用法
from PIL import Image
import matplotlib.pyplot as plt
import torch
from torchvision import transforms
from transformers import AutoModelForImageSegmentation
model = AutoModelForImageSegmentation.from_pretrained('briaai/RMBG-2.0', trust_remote_code=True)
torch.set_float32_matmul_precision(['high', 'highest'][0])
model.to('cuda')
model.eval()
image_size = (1024, 1024)
transform_image = transforms.Compose([
transforms.Resize(image_size),
transforms.ToTensor(),
transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
])
image = Image.open(input_image_path)
input_images = transform_image(image).unsqueeze(0).to('cuda')
with torch.no_grad():
preds = model(input_images)[-1].sigmoid().cpu()
pred = preds[0].squeeze()
pred_pil = transforms.ToPILImage()(pred)
mask = pred_pil.resize(image.size)
image.putalpha(mask)
image.save("no_bg_image.png")
📄 ライセンス
このモデルは、Creative Commons Attribution–Non-Commercial (CC BY-NC 4.0)ライセンスの下で公開されています。商用利用については、BRIAとの商用契約が必要です。こちらから詳細を確認できます。