MistoLineオープンソース制御ネットワークモデル - 無料でデプロイして多様な線画条件制御を実現

ホーム

Mistoline

TheMistoAIによって開発

多様な線画条件制御に適応可能で堅牢なSDXL制御ネットワークモデル

画像生成その他#SDXL線画制御 #多様な線画適応 #高精度画像生成

ダウンロード数 12.71k

リリース時間 : 5/7/2024

モデル概要

迷線制御はSDXL制御ネットワークモデルで、あらゆるタイプの線画入力を適応させ、非常に高い精度と優れた安定性を発揮します。ユーザーが提供する様々な線画から高品質な画像を生成できます。

モデル特徴

多様な線画適応

手描きスケッチ、制御ネットワーク線画前処理ツール出力、モデル生成輪郭など様々な線画入力を処理可能

高精度制御

ディテール再現、プロンプト整合性、安定性において優れた性能を発揮、特に複雑なシーンで

強力な汎化能力

異なる前処理ツールごとに異なるモデルを選択する必要がなく、単一モデルで多様な線画条件に対応

高解像度出力

短辺1024ピクセル以上の高品質画像生成をサポート

モデル能力

線画制御画像生成

スケッチレンダリング

モデルレンダリング

高解像度画像生成

使用事例

アート創作

スケッチから高品質画像へ

手描きスケッチを精巧なアート作品に変換

オリジナルの構図を保ちつつディテールと品質を向上

3Dモデルレンダリング

3Dモデルの輪郭線画からレンダリング効果を生成

スタイライズまたはリアルなレンダリング効果を実現

デザイン支援

コンセプトデザイン可視化

デザインスケッチを迅速に可視化効果図に変換

デザインイテレーションプロセスを加速

🚀 MistoLine

MistoLineは、あらゆる種類の線画入力に適応できる、汎用的かつ堅牢なSDXL - ControlNetモデルです。高精度と卓越した安定性を兼ね備え、ユーザーが提供する様々な線画に基づいて高品質な画像を生成します。

🚀 クイックスタート

MistoLineは、あらゆる種類の線画入力に適応できるSDXL - ControlNetモデルで、高精度と優れた安定性を示します。ユーザーが提供する様々な種類の線画（手描きのスケッチ、異なるControlNetの線前処理器、モデルが生成したアウトラインなど）に基づいて、短辺が1024pxを超える高品質な画像を生成できます。MistoLineは、異なる線前処理器に対して異なるControlNetモデルを選択する必要がなく、多様な線画条件に対して強い汎化能力を発揮します。

Intro Image
GitHub Repo

✨ 主な機能

禁止事項

このモデルの以下の使用は許可されていません。

法令違反
未成年者の危害や搾取
虚偽情報の作成と拡散
他人のプライバシー侵害
他人の中傷や嫌がらせ
他人の法的権利を害する自動的な決定
社会的行動や個人特性に基づく差別
特定のグループの脆弱性を利用した行動誘導
法的に保護された特性に基づく差別
医療アドバイスや診断結果の提供
法執行や移民などの目的での不適切な情報生成と使用

商用利用条件

このモデルを商用目的で使用または配布する場合は、以下の条件を遵守する必要があります。

製品のドキュメント、ウェブサイト、またはその他の目立つ場所で、TheMisto.aiがこのモデルに対して行った貢献を明確に記載してください。
例：「この製品は、TheMisto.aiが開発したMistoLine - SDXL - ControlNetを使用しています。」
製品に関する画面、READMEファイル、またはその他の同様の表示領域がある場合は、それらの領域に上記の帰属情報を含める必要があります。
上記の領域がない場合は、製品内の他の適切な場所に帰属情報を含め、最終ユーザーが気付くようにしてください。
TheMisto.aiがあなたの製品を推奨または宣伝していることを暗示してはなりません。帰属情報の使用は、このモデルの出所を示すためだけのものです。
特定のケースでの帰属方法に関する質問がある場合は、info@themisto.aiにお問い合わせください。

モデルの出力は検閲されておらず、著者は生成されたコンテンツの意見を支持するものではありません。自己責任で使用してください。

異なる線前処理器での適用

preprocessors

他のControlNetとの比較

comparison

💻 使用例

基本的な使用法

スケッチレンダリング

以下のケースでは、MistoLineのみをControlNetとして使用しています。 Sketch Rendering

モデルレンダリング

以下のケースでは、Anylineを前処理器とし、MistoLineをControlNetとして使用しています。 Model Rendering

高度な使用法

ComfyUIでの推奨パラメータ

sampler steps:30
CFG:7.0
sampler_name:dpmpp_2m_sde
scheduler:karras
denoise:0.93
controlnet_strength:1.0
stargt_percent:0.0
end_percent:0.9

Diffusersパイプライン

まず、ライブラリをインストールすることを確認してください。

pip install accelerate transformers safetensors opencv-python diffusers

そして、以下のコードで使用を開始できます。

from diffusers import ControlNetModel, StableDiffusionXLControlNetPipeline, AutoencoderKL
from diffusers.utils import load_image
from PIL import Image
import torch
import numpy as np
import cv2

prompt = "aerial view, a futuristic research complex in a bright foggy jungle, hard lighting"
negative_prompt = 'low quality, bad quality, sketches'

image = load_image("https://huggingface.co/datasets/hf-internal-testing/diffusers-images/resolve/main/sd_controlnet/hf-logo.png")

controlnet_conditioning_scale = 0.5

controlnet = ControlNetModel.from_pretrained(
    "TheMistoAI/MistoLine",
    torch_dtype=torch.float16,
    variant="fp16",
)
vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
pipe = StableDiffusionXLControlNetPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    controlnet=controlnet,
    vae=vae,
    torch_dtype=torch.float16,
)
pipe.enable_model_cpu_offload()

image = np.array(image)
image = cv2.Canny(image, 100, 200)
image = image[:, :, None]
image = np.concatenate([image, image, image], axis=2)
image = Image.fromarray(image)

images = pipe(
    prompt, negative_prompt=negative_prompt, image=image, controlnet_conditioning_scale=controlnet_conditioning_scale,
    ).images

images[0].save(f"hug_lab.png")

📚 ドキュメント

チェックポイント

mistoLine_rank256.safetensors : 一般的な使用バージョン、ComfyUIおよびAUTOMATIC1111 - WebUI用。
mistoLine_fp16.safetensors : FP16ウェイト、ComfyUIおよびAUTOMATIC1111 - WebUI用。

注意事項

!!!mistoLine_rank256.safetensorsはmistoLine_fp16.safetensorsよりも性能が優れています！！

ComfyUIでの使用方法

ComfyUI

中国（大陸地区）での便捷ダウンロード

リンク：https://pan.baidu.com/s/1DbZWmGJ40Uzr3Iz9RNBG_w?pwd=8mzs
パスワード：8mzs

引用

@misc{
      title={Adding Conditional Control to Text-to-Image Diffusion Models}, 
      author={Lvmin Zhang, Anyi Rao, Maneesh Agrawala},
      year={2023},
      eprint={2302.05543},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}