Cartoonizerオープンソース画像カートーン化モデル - 無料で画像をワンクリックでカートーンスタイルに変換

ホーム

Cartoonizer

instruction-tuning-sdによって開発

Stable Diffusion v1.5を基にした命令調整バージョンで、画像の漫画化処理に特化

画像生成その他オープンソースライセンス:MIT #画像の漫画化 #命令駆動編集 #芸術スタイル変換

ダウンロード数 232

リリース時間 : 3/18/2023

モデル概要

このモデルはStable Diffusionを基にした命令調整バージョンで、微調整により画像変換操作に関する特定の命令、特に画像の漫画化処理をより良く理解し実行できます。

モデル特徴

命令調整

モデルは特別に調整されており、画像変換命令をより良く理解し実行できます

高品質な漫画化

普通の写真を高品質で漫画スタイルの画像に変換できます

Stable Diffusionベース

強力なStable Diffusion v1.5を基にしており、安定した画像生成能力を持っています

モデル能力

画像スタイル変換

画像漫画化処理

命令ベースの画像編集

使用事例

アート創作

写真の漫画化

普通の写真を漫画スタイルのアート作品に変換

芸術的な漫画スタイルの画像を生成

コンテンツ創作

ソーシャルメディアコンテンツ制作

ソーシャルメディア向けにユニークな漫画スタイルのコンテンツを作成

魅力的な漫画スタイルの画像を迅速に生成

🚀 漫画化用の指示調整済みStable Diffusion (微調整済み)

このパイプラインは、Stable Diffusion (v1.5) の「指示調整済み」バージョンです。既存の InstructPix2Pix チェックポイントから微調整されています。

🚀 クイックスタート

このパイプラインのモチベーションは、一部 FLAN から、一部 InstructPix2Pix から来ています。主なアイデアは、まず指示付きのデータセットを作成し（私たちのブログで説明されているように）、その後 InstructPix2Pix スタイルのトレーニングを行うことです。最終的な目的は、画像変換関連の操作を伴う特定の指示により適切に従うことができるように Stable Diffusion を改善することです。

詳細はこの記事を参照してください。

✨ 主な機能

トレーニング手順と結果

トレーニングは instruction-tuning-sd/cartoonization データセットで行われました。詳細はこのリポジトリを参照してください。トレーニングログはここで確認できます。

以下は、このパイプラインから得られたいくつかの結果です：

想定される用途と制限

このパイプラインは、入力画像と入力プロンプトを使用して漫画化を行うために使用できます。

💻 使用例

基本的な使用法

import torch
from diffusers import StableDiffusionInstructPix2PixPipeline
from diffusers.utils import load_image

model_id = "instruction-tuning-sd/cartoonizer"
pipeline = StableDiffusionInstructPix2PixPipeline.from_pretrained(
    model_id, torch_dtype=torch.float16, use_auth_token=True
).to("cuda")

image_path = "https://hf.co/datasets/diffusers/diffusers-images-docs/resolve/main/mountain.png"
image = load_image(image_path)

image = pipeline("Cartoonize the following image", image=image).images[0]
image.save("image.png")

制限事項、誤用、悪意のある使用、想定外の使用に関する注意事項については、こちらのモデルカードを参照してください。

📚 ドキュメント

引用

FLAN

@inproceedings{
    wei2022finetuned,
    title={Finetuned Language Models are Zero-Shot Learners},
    author={Jason Wei and Maarten Bosma and Vincent Zhao and Kelvin Guu and Adams Wei Yu and Brian Lester and Nan Du and Andrew M. Dai and Quoc V Le},
    booktitle={International Conference on Learning Representations},
    year={2022},
    url={https://openreview.net/forum?id=gEZrGCozdqR}
}

InstructPix2Pix

@InProceedings{
    brooks2022instructpix2pix,
    author     = {Brooks, Tim and Holynski, Aleksander and Efros, Alexei A.},
    title      = {InstructPix2Pix: Learning to Follow Image Editing Instructions},
    booktitle  = {CVPR},
    year       = {2023},
}

Instruction-tuning for Stable Diffusion blog

@article{
  Paul2023instruction-tuning-sd,
  author = {Paul, Sayak},
  title = {Instruction-tuning Stable Diffusion with InstructPix2Pix},
  journal = {Hugging Face Blog},
  year = {2023},
  note = {https://huggingface.co/blog/instruction-tuning-sd},
}