sd-controlnet-openposeオープンソースモデル - 人体姿勢制御で簡単にカスタム画像を生成

ホーム

Sd Controlnet Openpose

lllyasvielによって開発

ControlNetは人体姿勢推定条件でStable Diffusionの画像生成を制御するニューラルネットワーク構造

画像生成その他オープンソースライセンス:Openrail #姿勢制御生成 #OpenPose骨格駆動 #画像条件制御

ダウンロード数 5,756

リリース時間 : 2/24/2023

モデル概要

このモデルはStable Diffusion v1-5をベースに、OpenPose骨格図を制御条件として、人体姿勢を精密に制御した画像生成を実現

モデル特徴

姿勢精密制御

OpenPose骨格図で生成画像中の人物姿勢を精密に制御

少量データ学習

5万以下のサンプルで効果的に学習可能、データが限られた場面に適応

デバイス互換性

コンシューマー向けGPUデバイスでの推論と微調整をサポート

モデル能力

人体姿勢推定

条件付き画像生成

テキスト誘導画像合成

使用事例

デジタルアート創作

キャラクターポーズデザイン

骨格図を指定して異なるポーズのキャラクターコンセプト図を迅速生成

キャラクターの外見一貫性を保ちつつ姿勢を精密制御

映像プリビジュアライゼーション

ストーリーボードスケッチ生成

簡易骨格図でシーン人物レイアウトを迅速生成

プリプロダクション工程を加速

🚀 Controlnet - Human Pose Version

ControlNetは、追加の条件を加えることで拡散モデルを制御するニューラルネットワーク構造です。このチェックポイントは、人体姿勢推定に基づくControlNetに対応しています。Stable Diffusionと組み合わせて使用することができます。

📚 ドキュメント

🔍 モデルの詳細

属性	详情
開発者	Lvmin Zhang, Maneesh Agrawala
モデルタイプ	拡散ベースのテキストから画像への生成モデル
言語	英語
ライセンス	The CreativeML OpenRAIL M license は Open RAIL M license であり、BigScience と the RAIL Initiative が共同で責任あるAIライセンスの分野で行っている作業から適応されています。また、私たちのライセンスが基づいている the article about the BLOOM Open RAIL license も参照してください。
詳細情報のリソース	GitHub Repository, Paper
引用形式	@misc{zhang2023adding, title={Adding Conditional Control to Text-to-Image Diffusion Models}, author={Lvmin Zhang and Maneesh Agrawala}, year={2023}, eprint={2302.05543}, archivePrefix={arXiv}, primaryClass={cs.CV} }

📖 概要

Controlnetは、Lvmin ZhangとManeesh Agrawalaによる Adding Conditional Control to Text-to-Image Diffusion Models で提案されました。

概要は以下の通りです。

私たちは、事前学習された大規模拡散モデルを制御して追加の入力条件をサポートするニューラルネットワーク構造であるControlNetを提案します。ControlNetは、タスク固有の条件をエンドツーエンドで学習し、学習データセットが小さい場合（< 50k）でも学習は堅牢です。さらに、ControlNetの学習は拡散モデルの微調整と同じくらい速く、モデルは個人用デバイスで学習できます。あるいは、強力な計算クラスタが利用可能な場合、モデルは大量（数百万から数十億）のデータにスケーリングできます。私たちは、Stable Diffusionのような大規模拡散モデルにControlNetを追加して、エッジマップ、セグメンテーションマップ、キーポイントなどの条件付き入力を可能にできることを報告しています。これにより、大規模拡散モデルを制御する方法が豊富になり、関連するアプリケーションがさらに促進される可能性があります。

📦 公開されたチェックポイント

著者らは、Stable Diffusion v1 - 5 を使用して、異なるタイプの条件付きで学習された8つの異なるチェックポイントを公開しました。

モデル名	制御画像の概要	制御画像の例	生成画像の例
lllyasviel/sd-controlnet-canny キャニーエッジ検出で学習	黒い背景に白いエッジがあるモノクロ画像。
lllyasviel/sd-controlnet-depth Midas深度推定で学習	黒が深い領域、白が浅い領域を表すグレースケール画像。
lllyasviel/sd-controlnet-hed HEDエッジ検出（ソフトエッジ）で学習	黒い背景に白いソフトエッジがあるモノクロ画像。
lllyasviel/sd-controlnet-mlsd M - LSD線検出で学習	黒い背景に白い直線のみで構成されたモノクロ画像。
lllyasviel/sd-controlnet-normal 法線マップで学習	法線マッピングされた画像。
lllyasviel/sd-controlnet_openpose OpenPose骨格画像で学習	OpenPose骨格画像。
lllyasviel/sd-controlnet_scribble 人間のスクライブで学習	黒い背景に白い輪郭がある手書きのモノクロ画像。
lllyasviel/sd-controlnet_seg セマンティックセグメンテーションで学習	ADE20K のセグメンテーションプロトコル画像。

💻 使用例

基本的な使用法

このチェックポイントは Stable Diffusion v1 - 5 で学習されているため、これと一緒に使用することをお勧めします。実験的には、このチェックポイントはdreamboothed stable diffusionなどの他の拡散モデルとも使用できます。

注意: 画像を処理して補助条件を作成する場合は、以下のように外部依存関係が必要です。

https://github.com/patrickvonplaten/controlnet_aux をインストールします。

$ pip install controlnet_aux

diffusers と関連パッケージをインストールします。

$ pip install diffusers transformers accelerate

コードを実行します。

from PIL import Image
from diffusers import StableDiffusionControlNetPipeline, ControlNetModel, UniPCMultistepScheduler
import torch
from controlnet_aux import OpenposeDetector
from diffusers.utils import load_image

openpose = OpenposeDetector.from_pretrained('lllyasviel/ControlNet')

image = load_image("https://huggingface.co/lllyasviel/sd-controlnet-openpose/resolve/main/images/pose.png")

image = openpose(image)

controlnet = ControlNetModel.from_pretrained(
    "lllyasviel/sd-controlnet-openpose", torch_dtype=torch.float16
)

pipe = StableDiffusionControlNetPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5", controlnet=controlnet, safety_checker=None, torch_dtype=torch.float16
)

pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config)

# xformersがインストールされていない場合は削除してください
# インストール手順については https://huggingface.co/docs/diffusers/v0.13.0/en/optimization/xformers#installing-xformers を参照してください
pipe.enable_xformers_memory_efficient_attention()

pipe.enable_model_cpu_offload()

image = pipe("chef in the kitchen", image, num_inference_steps=20).images[0]

image.save('images/chef_pose_out.png')