Rm

cocktailpeanutによって開発

BRIA RMBG v2.0は、非商用用途に適した、あらゆるタイプの画像から前景と背景を効率的に分離するために設計された最先端の背景除去モデルです。

画像セグメンテーション

Transformers

オープンソースライセンス:その他 #高精度セグメンテーション #Eコマースレベルの背景除去 #マルチシーン適応

ダウンロード数 1,769

リリース時間 : 4/12/2025

モデル概要

BRIA RMBG-2.0は、プロフェッショナル級のデータセットでトレーニングされた二値画像セグメンテーションモデルで、画像の背景を効率的に除去し、さまざまな画像タイプやシーンに対応します。

モデル特徴

効率的な背景除去

さまざまなカテゴリや画像タイプの前景と背景を効率的に分離するように設計されており、スケーラブルなエンタープライズ級コンテンツ作成に適しています。

マルチシーン適応性

精度、効率、マルチシーン適応性において、主要なオープンソースモデルに匹敵し、コンテンツセーフティ、合法ライセンスデータセット、バイアス低減のシナリオに適しています。

プロフェッショナルデータセットトレーニング

15,000以上の高解像度、手動ピクセルレベルアノテーション、完全ライセンス画像を使用してトレーニングされ、一般的なストックフォト、Eコマース、ゲーム、広告コンテンツをカバーしています。

モデル能力

画像背景除去

前景と背景の分離

さまざまな画像タイプの効率的な処理

使用事例

Eコマース

商品画像処理

Eコマースプラットフォームでの表示のために商品画像の背景を除去します。

商品展示効果の向上と後処理プロセスの簡素化。

広告コンテンツ作成

広告画像の背景を迅速に除去し、コンテンツ作成を容易にします。

広告制作効率の向上と視覚効果の最適化。

ゲーム

ゲーム素材処理

ゲーム内のキャラクターやシーン画像を処理し、背景を除去します。

ゲーム開発プロセスの簡素化と素材品質の向上。

🚀 BRIA Background Removal v2.0 モデルカード

RMBG v2.0は、当社の最新の背景除去モデルで、RMBG v1.4を大幅に改善しています。このモデルは、さまざまなカテゴリや画像タイプで前景と背景を効果的に分離するように設計されています。このモデルは、一般的なストック画像、電子商取引、ゲーム、広告コンテンツなど、慎重に選択されたデータセットで学習されており、エンタープライズのコンテンツ作成を大規模でサポートする商用ユースケースに適しています。現在、その精度、効率、汎用性は、主要なソースオープンモデルに匹敵しています。コンテンツの安全性、法的にライセンスされたデータセット、バイアスの軽減が重要な場面で最適です。

BRIA AIによって開発されたRMBG v2.0は、非商用利用のためのソースオープンモデルとして提供されています。

アクセス方法

Bria RMBG2.0は、ソースコードと重み、ComfyUIノード、またはAPIエンドポイントとして、あらゆる場所で利用できます。

購入: 商用ライセンスを購入するには、こちらをクリックしてください。
APIエンドポイント: Bria.ai、fal.ai
ComfyUI: ワークフローで使用する

詳細については、当社のウェブサイトをご覧ください。

より詳しい情報、チュートリアル、ツール、および他のユーザーとの交流のために、Discordコミュニティに参加してください！

デモを見るにはここをクリック

examples

📚 ドキュメント

モデルの詳細

プロパティ	詳細
開発元	BRIA AI
モデルタイプ	背景除去
ライセンス	Creative Commons Attribution–Non-Commercial (CC BY-NC 4.0)。このモデルは非商用利用のためにCC BY-NC 4.0ライセンスの下で公開されています。商用利用は、BRIAとの商用契約が必要です。こちらから利用可能です。

学習データ

Bria-RMBGモデルは、15,000以上の高品質、高解像度、手動でラベル付けされた（ピクセル単位の精度）、完全にライセンスされた画像で学習されています。ベンチマークには、バランスの取れた性別、民族、およびさまざまな障害を持つ人々が含まれています。明確にするために、異なるカテゴリによるデータ分布を提供しており、このモデルの汎用性を示しています。

カテゴリ	分布
オブジェクトのみ	45.11%
オブジェクト/動物と一緒の人物	25.24%
人物のみ	17.35%
テキスト付きの人物/オブジェクト/動物	8.52%
テキストのみ	2.52%
動物のみ	1.89%

カテゴリ	分布
写実的	87.70%
非写実的	12.30%

カテゴリ	分布
非単色背景	52.05%
単色背景	47.95%

カテゴリ	分布
単一の主要な前景オブジェクト	51.42%
前景に複数のオブジェクト	48.58%

定性的評価

オープンソースモデルとの比較 diagram examples

アーキテクチャ

RMBG-2.0は、BiRefNetアーキテクチャをベースに、独自のデータセットと学習スキームで強化されています。この学習データは、背景除去タスクにおけるモデルの精度と有効性を大幅に向上させています。

もしこのモデルを研究で使用する場合は、以下を引用してください。

@article{BiRefNet,
  title={Bilateral Reference for High-Resolution Dichotomous Image Segmentation},
  author={Zheng, Peng and Gao, Dehong and Fan, Deng-Ping and Liu, Li and Laaksonen, Jorma and Ouyang, Wanli and Sebe, Nicu},
  journal={CAAI Artificial Intelligence Research},
  year={2024}
}

必要条件

torch
torchvision
pillow
kornia
transformers

💻 使用例

基本的な使用法

from PIL import Image
import matplotlib.pyplot as plt
import torch
from torchvision import transforms
from transformers import AutoModelForImageSegmentation

model = AutoModelForImageSegmentation.from_pretrained('briaai/RMBG-2.0', trust_remote_code=True)
torch.set_float32_matmul_precision(['high', 'highest'][0])
model.to('cuda')
model.eval()

# Data settings
image_size = (1024, 1024)
transform_image = transforms.Compose([
    transforms.Resize(image_size),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
])

image = Image.open(input_image_path)
input_images = transform_image(image).unsqueeze(0).to('cuda')

# Prediction
with torch.no_grad():
    preds = model(input_images)[-1].sigmoid().cpu()
pred = preds[0].squeeze()
pred_pil = transforms.ToPILImage()(pred)
mask = pred_pil.resize(image.size)
image.putalpha(mask)

image.save("no_bg_image.png")