birefnet-portraitオープンソース画像分割モデル - マルチタスクに対応し、高解像度画像の高精度な分割を実現

ホーム

Birefnet Portrait

aigchackerによって開発

BiRefNetは高解像度二分画像分割モデルで、双方向参照フレームワークを採用し、複数の画像分割タスクで優れた性能を発揮します。

画像セグメンテーション

Safetensors

#高解像度画像分割 #双方向参照フレームワーク #擬装物体検出

ダウンロード数 4,021

リリース時間 : 7/30/2024

モデル概要

BiRefNetは高解像度二分画像分割に特化した深層学習モデルで、双方向参照フレームワーク設計を採用し、背景除去、マスク生成などのタスクを効果的に処理でき、擬装物体検出や顕著物体検出などのタスクで優れた性能を示します。

モデル特徴

高解像度処理能力

高解像度画像の分割タスクに特化して設計

双方向参照フレームワーク

革新的な双方向参照フレームワーク設計で分割精度を向上

マルチタスク適応性

背景除去、マスク生成、擬装物体検出など複数タスクで優れた性能

モデル能力

画像分割

背景除去

マスク生成

擬装物体検出

顕著物体検出

使用事例

画像編集

ポートレート背景除去

ポートレート写真から被写体と背景を精密に分離

高品質な透明背景ポートレートを生成

製品画像処理

ECサイト製品画像の背景除去と被写体抽出

クリーンな製品展示画像を生成

コンピュータビジョン

擬装物体検出

環境に溶け込んだ物体を検出

隠蔽物体の認識率向上

顕著物体検出

画像中最も目立つ領域を識別

顕著領域を正確にマーキング

🚀 BiRefNet

BiRefNetは、高解像度の二値画像セグメンテーションに特化したモデルです。このモデルは、背景除去、マスク生成、二値画像セグメンテーション、カモフラージュ物体検出、顕著物体検出などのタスクにおいて優れた性能を発揮します。

🚀 クイックスタート

このリポジトリは、論文 "Bilateral Reference for High-Resolution Dichotomous Image Segmentation" (CAAI AIR 2024) の公式実装です。詳細なコード、ドキュメント、モデルズーは、GitHubリポジトリ https://github.com/ZhengPeng7/BiRefNet を参照してください。

Peng Zheng^1,4,5,6, Dehong Gao², Deng-Ping Fan^1*, Li Liu³, Jorma Laaksonen⁴, Wanli Ouyang⁵, Nicu Sebe⁶

¹南开大学 ²西北工業大学 ³国防科技大学 ⁴アールト大学 ⁵上海人工知能実験室 ⁶トレント大学

DIS-Sample_1	DIS-Sample_2

📦 インストール

0. パッケージのインストール

pip install -qr https://raw.githubusercontent.com/ZhengPeng7/BiRefNet/main/requirements.txt

💻 使用例

基本的な使用法

HuggingFaceのコードと重みを使用する場合

HuggingFace上の重みのみを使用します。利点は、BiRefNetのコードを手動でダウンロードする必要がないことです。欠点は、HuggingFace上のコードが最新バージョンでない可能性があることです（できるだけ最新に保つように努めます）。

# 重み付きでBiRefNetをロード
from transformers import AutoModelForImageSegmentation
birefnet = AutoModelForImageSegmentation.from_pretrained('zhengpeng7/BiRefNet-portrait', trust_remote_code=True)

GitHubのコードとHuggingFaceの重みを使用する場合

HuggingFace上の重みのみを使用します。利点は、コードが常に最新であることです。欠点は、GitHubからBiRefNetのリポジトリをクローンする必要があることです。

# コードのダウンロード
git clone https://github.com/ZhengPeng7/BiRefNet.git
cd BiRefNet

# ローカルのコードを使用
from models.birefnet import BiRefNet

# Hugging Face Modelsから重みをロード
birefnet = BiRefNet.from_pretrained('zhengpeng7/BiRefNet-portrait')

GitHubのコードとHuggingFaceの重みを使用する場合

重みとコードの両方をローカルで使用します。

# ローカルのコードと重みを使用
import torch
from utils import check_state_dict

birefnet = BiRefNet(bb_pretrained=False)
state_dict = torch.load(PATH_TO_WEIGHT, map_location='cpu')
state_dict = check_state_dict(state_dict)
birefnet.load_state_dict(state_dict)

ロードしたBiRefNetを推論に使用する場合

# インポート
from PIL import Image
import matplotlib.pyplot as plt
import torch
from torchvision import transforms
from models.birefnet import BiRefNet

birefnet = ... # -- BiRefNetは上記のコードでロードする必要があります。
torch.set_float32_matmul_precision(['high', 'highest'][0])
birefnet.to('cuda')
birefnet.eval()

def extract_object(birefnet, imagepath):
    # データ設定
    image_size = (1024, 1024)
    transform_image = transforms.Compose([
        transforms.Resize(image_size),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ])

    image = Image.open(imagepath)
    input_images = transform_image(image).unsqueeze(0).to('cuda')

    # 予測
    with torch.no_grad():
        preds = birefnet(input_images)[-1].sigmoid().cpu()
    pred = preds[0].squeeze()
    pred_pil = transforms.ToPILImage()(pred)
    mask = pred_pil.resize(image.size)
    image.putalpha(mask)
    return image, mask

# 可視化
plt.axis("off")
plt.imshow(extract_object(birefnet, imagepath='PATH-TO-YOUR_IMAGE.jpg')[0])
plt.show()

このBiRefNetは、標準的な二値画像セグメンテーション（DIS）に特化しており、DIS-TR で学習され、DIS-TEs と DIS-VD で検証されています。

📚 詳細ドキュメント

このリポジトリには、論文で提案されたBiRefNetの重みが含まれており、3つのタスク（DIS、HRSOD、COD）でSOTAの性能を達成しています。BiRefNetのコードと最新の更新情報は、GitHubページ https://github.com/ZhengPeng7/BiRefNet を参照してください。

オンラインデモで推論を試す

Colabでのオンライン 単一画像推論：
Hugging Faceでの GUI付きオンライン推論（解像度調整可能）：
与えられた重みの 推論と評価：

謝辞

@fal さんには、より良いBiRefNetモデルを学習するためのGPUリソースを提供していただき、心より感謝申し上げます。
@not-lain さんには、HuggingFace上でのBiRefNetモデルのより良いデプロイメントに協力していただき、感謝申し上げます。

引用

@article{BiRefNet,
  title={Bilateral Reference for High-Resolution Dichotomous Image Segmentation},
  author={Zheng, Peng and Gao, Dehong and Fan, Deng-Ping and Liu, Li and Laaksonen, Jorma and Ouyang, Wanli and Sebe, Nicu},
  journal={CAAI Artificial Intelligence Research},
  year={2024}
}