RMBG-2.0オープンソース背景除去モデル - 無料でデプロイ可能、画像の前景と背景を効率的に分離、商用創作に適しています

ホーム

RMBG 2.0

briaaiによって開発

BRIA AIが開発した最新の背景除去モデルで、様々な画像の前景と背景を効果的に分離でき、大規模な商業コンテンツ制作シーンに適しています。

画像セグメンテーション

Transformers

オープンソースライセンス:その他 #高精度画像セグメンテーション #EC商品の切り抜き #複数主体分離

ダウンロード数 703.33k

リリース時間 : 10/29/2024

モデル概要

BRIA RMBG-2.0はプロフェッショナルレベルのデータセットで訓練された二値画像セグメンテーションモデルで、8ビット単一チャンネルのグレースケールマスクを出力し、前景分離の閾値をカスタマイズできます。

モデル特徴

高精度背景除去

様々な画像の前景と背景を効果的に分離でき、正確性、効率性、汎用性の面で優れた性能を発揮します。

プロフェッショナルトレーニングデータ

15,000枚以上の高品質・高解像度で手動アノテーションされた完全ライセンス画像を使用して訓練されています。

多様な出力

8ビット単一チャンネルのグレースケールマスクを提供し、前景分離の閾値をカスタマイズできるため、多様なニーズに対応できます。

コンテンツセキュリティ

コンテンツの安全性、合法的なライセンスデータセット、バイアスコントロールなどの重要な要素に重点を置いています。

モデル能力

画像背景除去

前景分離

画像セグメンテーション

使用事例

商品画像処理

商品画像の背景を素早く除去し、展示効果を向上させます。

透明背景の商品画像を生成

広告デザイン

広告素材制作

広告内の主要要素を迅速に分離し、後期合成を容易にします。

クリーンな広告要素を取得

ゲーム開発

ゲーム素材処理

ゲームキャラクターとシーン要素を分離し、リソースの再利用を容易にします。

透明背景のゲーム素材を取得

🚀 BRIA Background Removal v2.0 モデルカード

RMBG v2.0は、最新技術の背景除去モデルで、RMBG v1.4を大幅に改善しています。このモデルは、さまざまなカテゴリと画像タイプで前景と背景を効果的に分離するように設計されています。このモデルは、一般的なストック画像、電子商取引、ゲーム、広告コンテンツなどを含む、慎重に選択されたデータセットで学習されており、エンタープライズのコンテンツ作成を大規模にサポートする商用ユースケースに適しています。現在、その精度、効率、汎用性は、主要なソースオープンモデルに匹敵しています。コンテンツの安全性、法的にライセンスされたデータセット、バイアスの軽減が重要な場面に最適です。

BRIA AIによって開発されたRMBG v2.0は、非商用利用のためのソースオープンモデルとして利用可能です。

アクセス方法

Bria RMBG2.0は、ソースコードと重み、ComfyUIノード、またはAPIエンドポイントとして、あなたが構築するあらゆる場所で利用可能です。

購入: 商用ライセンスを取得するには、こちらをクリックしてください。
APIエンドポイント: Bria.ai、fal.ai
ComfyUI: ワークフローで使用する

詳細については、ウェブサイトをご覧ください。

より詳しい情報、チュートリアル、ツール、および他のユーザーとのコミュニケーションについては、Discordコミュニティに参加してください！

デモを見るにはここをクリック

examples

📚 詳細ドキュメント

モデルの説明

属性	详情
開発元	BRIA AI
モデルタイプ	背景除去
ライセンス	Creative Commons Attribution–Non-Commercial (CC BY-NC 4.0)。このモデルは非商用利用のためにCC BY-NC 4.0ライセンスの下で公開されています。商用利用については、BRIAとの商用契約が必要です。こちらから詳細を確認できます。
モデルの説明	BRIA RMBG-2.0は、専門グレードのデータセットでのみ学習された二値画像セグメンテーションモデルです。モデルの出力には、単一チャンネルの8ビットグレースケールアルファマットが含まれ、各ピクセル値は元の画像の対応するピクセルの不透明度レベルを示します。この非二値出力アプローチにより、開発者は前景と背景の分離にカスタム閾値を定義することができ、さまざまなユースケースの要件に対応し、複雑なパイプラインへの統合を強化します。
BRIAについて	詳細な情報については、BRIA AIを参照してください。

学習データ

Bria-RMBGモデルは、15,000以上の高品質、高解像度、手動でラベル付けされた（ピクセル単位の精度）、完全にライセンスされた画像を使用して学習されています。ベンチマークには、バランスの取れた性別、民族、およびさまざまな障害を持つ人々が含まれています。明確化のために、さまざまなカテゴリによるデータ分布を提供しており、これはモデルの汎用性を示しています。

画像の分布

カテゴリ	分布
オブジェクトのみ	45.11%
オブジェクト/動物を伴う人物	25.24%
人物のみ	17.35%
テキストを伴う人物/オブジェクト/動物	8.52%
テキストのみ	2.52%
動物のみ	1.89%

カテゴリ	分布
写実的	87.70%
非写実的	12.30%

カテゴリ	分布
非単色背景	52.05%
単色背景	47.95%

カテゴリ	分布
単一の主要な前景オブジェクト	51.42%
前景に複数のオブジェクト	48.58%

定性評価

オープンソースモデルの比較 diagram examples

アーキテクチャ

RMBG-2.0は、BiRefNetアーキテクチャを基に、独自のデータセットと学習スキームを用いて開発されています。この学習データにより、背景除去タスクにおけるモデルの精度と有効性が大幅に向上しています。
このモデルを研究で使用する場合は、以下を引用してください。

@article{BiRefNet,
  title={Bilateral Reference for High-Resolution Dichotomous Image Segmentation},
  author={Zheng, Peng and Gao, Dehong and Fan, Deng-Ping and Liu, Li and Laaksonen, Jorma and Ouyang, Wanli and Sebe, Nicu},
  journal={CAAI Artificial Intelligence Research},
  year={2024}
}

必要条件

torch
torchvision
pillow
kornia
transformers

💻 使用例

基本的な使用法

from PIL import Image
import matplotlib.pyplot as plt
import torch
from torchvision import transforms
from transformers import AutoModelForImageSegmentation

model = AutoModelForImageSegmentation.from_pretrained('briaai/RMBG-2.0', trust_remote_code=True)
torch.set_float32_matmul_precision(['high', 'highest'][0])
model.to('cuda')
model.eval()

# Data settings
image_size = (1024, 1024)
transform_image = transforms.Compose([
    transforms.Resize(image_size),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
])

image = Image.open(input_image_path)
input_images = transform_image(image).unsqueeze(0).to('cuda')

# Prediction
with torch.no_grad():
    preds = model(input_images)[-1].sigmoid().cpu()
pred = preds[0].squeeze()
pred_pil = transforms.ToPILImage()(pred)
mask = pred_pil.resize(image.size)
image.putalpha(mask)

image.save("no_bg_image.png")