BRIA-2.3-ControlNet-Generative-Fillオープンソースモデル - 商用ライセンスによる高品質画像補間の保証

Home

BRIA 2.3 ControlNet Generative Fill

Developed by briaai

商用ライセンスデータセットでトレーニングされた生成型補完モデルで、法的責任保証と高品質な画像補完機能を提供

画像生成 Open Source License:Other #商用ライセンスセキュリティ #法的責任保証 #ブロックマスク最適化

Downloads 120

Release Time : 11/19/2024

Model Overview

画像マスク領域の補完専用に設計された拡散モデルで、オブジェクトの置換、追加、修正をサポートし、15%以上のブロックマスクを最適化

Model Features

商用法的保証

トレーニングデータは完全に準拠しており、著作権侵害、プライバシー侵害、有害コンテンツに対する完全な法的責任カバレッジを提供

高速生成最適化

FAST-LORA技術をサポートし、A10 GPUでわずか1.6秒で生成を完了

プロフェッショナル級データセット

世界最大の多様な商用ライセンスデータセットでトレーニングされ、著作権保護素材を含まない

Model Capabilities

画像マスク補完

オブジェクト置換

画像コンテンツ追加

画像コンテンツ修正

Use Cases

画像編集

製品画像修正

製品画像から特定要素を迅速に削除または置換

画像の自然さを保ちつつ精密な編集を実現

クリエイティブデザイン

デザイン案に新要素を追加または既存構図を修正

クリエイティブな構想を効率的に実現

🚀 BRIA 2.3 ControlNet Generative Fill Fast

BRIA 2.3 Generative Fillは、最大規模のマルチソース商用グレードのライセンス付きデータセットでのみトレーニングされており、商用利用に安全でありながら最高品質を保証します。このモデルは、著作権やプライバシー侵害、有害コンテンツの軽減に関する完全な法的責任を負います。なぜなら、当社のデータセットには、架空のキャラクター、ロゴ、商標、著名人、有害コンテンツ、またはプライバシー侵害コンテンツなどの著作権保護された素材が含まれていないからです。

BRIA 2.3 Generative Fillは、ユーザーが提供するテキストプロンプトに基づいて画像内のマスクされた領域を埋めるために設計されたモデルです。このモデルは、画像内のオブジェクトの置換、追加、変更など、さまざまなシナリオに適用できます。

このモデルはすべてのタイプのマスクで動作しますが、画像領域の15％以上を占めるブロブ形状のマスクで最適化されています。

🚀 クイックスタート

アクセスの取得

BRIA 2.3 ControlNet - Generative Fillには、BRIA 2.3 Foundationモデルへのアクセスが必要です。詳細については、こちらをクリックしてください。

APIエンドポイント: Bria.ai、fal.ai
ComfyUI: ワークフローで使用する

詳細については、当社のウェブサイトをご覧ください。

当社のDiscordコミュニティに参加して、詳細情報、チュートリアル、ツールを入手し、他のユーザーと交流しましょう！

デモを見る

✨ 主な機能

最大規模のマルチソース商用グレードのライセンス付きデータセットでトレーニングされ、商用利用に最適。
著作権やプライバシー侵害、有害コンテンツに関する完全な法的責任を負う。
ユーザーが提供するテキストプロンプトに基づいて画像内のマスクされた領域を埋めることができる。
すべてのタイプのマスクで動作し、ブロブ形状のマスクで最適化されている。

📚 ドキュメント

新機能

BRIA 2.3 ControlNet Generative Fillは、BRIA 2.3 Text - to - Imageの上で動作し、Fast - LORAを使用できます。これにより、非常に高速な生成埋め込みモデルが実現され、A10 GPUを使用した場合、わずか1.6秒で処理できます。

モデルの説明

属性	详情
開発元	BRIA AI
モデルタイプ	潜在拡散画像-to-画像モデル
ライセンス	bria - 2.3 inpaintingライセンス条項。モデルのライセンス取得とアクセスには購入が必要です。
モデルの説明	BRIA 2.3 Generative Fillは、専門グレードのライセンス付きデータセットでのみトレーニングされています。商用利用を目的として設計されており、完全な法的責任を負います。
詳細情報のリソース	BRIA AI

💻 使用例

基本的な使用法

# Tested with:
# diffusers==0.27.2
# transformers==4.47.1
# torch==2.3.0 (on CUDA 12.1)
# peft==0.14.0
# huggingface_hub==0.25.2

from diffusers import (
    AutoencoderKL,
    LCMScheduler,
)
from pipeline_controlnet_sd_xl import StableDiffusionXLControlNetPipeline
from controlnet import ControlNetModel, ControlNetConditioningEmbedding
import torch
import numpy as np
from PIL import Image
import requests
import PIL
from io import BytesIO
from torchvision import transforms
import pandas as pd 
import os 


def resize_image_to_retain_ratio(image):
    pixel_number = 1024*1024
    granularity_val = 8
    ratio = image.size[0] / image.size[1]
    width = int((pixel_number * ratio) ** 0.5)
    width = width - (width % granularity_val)
    height = int(pixel_number / width)
    height = height - (height % granularity_val)

    image = image.resize((width, height))
    return image


def download_image(url):
    response = requests.get(url)
    return PIL.Image.open(BytesIO(response.content)).convert("RGB")


def get_masked_image(image, image_mask, width, height):
    image_mask = image_mask # fill area is white
    image_mask = image_mask.resize((width, height)) # object to remove is white (1)
    image_mask_pil = image_mask
    image = np.array(image.convert("RGB")).astype(np.float32) / 255.0
    image_mask = np.array(image_mask_pil.convert("L")).astype(np.float32) / 255.0
    assert image.shape[0:1] == image_mask.shape[0:1], "image and image_mask must have the same image size"
    masked_image_to_present = image.copy()
    masked_image_to_present[image_mask > 0.5] = (0.5,0.5,0.5)  # set as masked pixel
    image[image_mask > 0.5] = 0.5  # set as masked pixel - s.t. will be grey 
    image = Image.fromarray((image * 255.0).astype(np.uint8))
    masked_image_to_present = Image.fromarray((masked_image_to_present * 255.0).astype(np.uint8))
    return image, image_mask_pil, masked_image_to_present


image_transforms = transforms.Compose(
    [
        transforms.ToTensor(),
    ]
)

default_negative_prompt = "blurry"

img_url = "https://raw.githubusercontent.com/CompVis/latent-diffusion/main/data/inpainting_examples/overture-creations-5sI6fQgYIuo.png"
mask_url = "https://raw.githubusercontent.com/CompVis/latent-diffusion/main/data/inpainting_examples/overture-creations-5sI6fQgYIuo_mask.png"

init_image = download_image(img_url).resize((1024, 1024))
mask_image = download_image(mask_url).resize((1024, 1024))


init_image = resize_image_to_retain_ratio(init_image)
width, height = init_image.size

mask_image = mask_image.convert("L").resize(init_image.size)

width, height = init_image.size

# Load, init model    
controlnet = ControlNetModel().from_pretrained("briaai/BRIA-2.3-ControlNet-Generative-Fill", torch_dtype=torch.float16)
vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
pipe = StableDiffusionXLControlNetPipeline.from_pretrained("briaai/BRIA-2.3", controlnet=controlnet.to(dtype=torch.float16), torch_dtype=torch.float16, vae=vae) #force_zeros_for_empty_prompt=False, # vae=vae)

pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config)
pipe.load_lora_weights("briaai/BRIA-2.3-FAST-LORA")
pipe.fuse_lora()
pipe = pipe.to(device="cuda")

# pipe.enable_xformers_memory_efficient_attention()

generator = torch.Generator(device="cuda").manual_seed(123456)

vae = pipe.vae


masked_image, image_mask, masked_image_to_present = get_masked_image(init_image, mask_image, width, height)

masked_image_tensor = image_transforms(masked_image)
masked_image_tensor = (masked_image_tensor - 0.5) / 0.5


masked_image_tensor = masked_image_tensor.unsqueeze(0).to(device="cuda")
control_latents = vae.encode(  
        masked_image_tensor[:, :3, :, :].to(vae.dtype)
    ).latent_dist.sample()   
control_latents = control_latents * vae.config.scaling_factor 


image_mask = np.array(image_mask)[:,:]
mask_tensor = torch.tensor(image_mask, dtype=torch.float32)[None, ...]
# binarize the mask
mask_tensor = torch.where(mask_tensor > 128.0, 255.0, 0)       

mask_tensor = mask_tensor / 255.0

mask_tensor = mask_tensor.to(device="cuda")
mask_resized = torch.nn.functional.interpolate(mask_tensor[None, ...], size=(control_latents.shape[2], control_latents.shape[3]), mode='nearest')

masked_image = torch.cat([control_latents, mask_resized], dim=1)

prompt = ""

gen_img = pipe(negative_prompt=default_negative_prompt, prompt=prompt, 
            controlnet_conditioning_scale=1.0, 
            num_inference_steps=12, 
            height=height, width=width, 
            image = masked_image, # control image
            init_image = init_image,     
            mask_image = mask_tensor,
            guidance_scale = 1.2,
            generator=generator).images[0]