Van - Gogh - diffusionオープンソース画像生成モデル - テキストを無料でヴァン・ゴッホのアートスタイルの画像に変換

ホーム

Van Gogh Diffusion

dallinmackayによって開発

Stable Diffusion v1.5を微調整したゴッホの芸術スタイルのテキストから画像生成モデル。トレーニングデータは映画『ゴッホ～最期の手紙～』のスクリーンショットを使用

画像生成オープンソースライセンス:Openrail #ゴッホの芸術スタイル #油絵効果生成 #映画スクリーンショットトレーニング

ダウンロード数 640

リリース時間 : 11/5/2022

モデル概要

ゴッホの独特な絵画スタイルを持つ画像を生成する専門モデル。プロンプトの先頭に'lvngvncnt'タグを追加してスタイル効果をアクティブにする必要があります

モデル特徴

ゴッホの芸術スタイル

特殊タグでゴッホ特有の油絵の筆跡と色彩表現をアクティブ化

映画データトレーニング

『ゴッホ～最期の手紙～』の映画スクリーンショットをトレーニングデータとして使用し、ゴッホスタイルの真髄を捉える

最適化サンプリング手法

最高の芸術効果を得るため、Eulerサンプラー（Euler_aではない）の使用を推奨

モデル能力

テキストから画像生成

芸術スタイル変換

人物肖像生成

風景画生成

使用事例

デジタルアート創作

ゴッホスタイル肖像

ゴッホの筆跡特徴を持つ人物肖像を生成

プレビュー画像に示される黄色調の顔の特徴と大胆な筆跡

風景画創作

一般的な風景をゴッホスタイルの風景画に変換

プレビュー画像に示される星空効果と独特の色彩表現

芸術教育

スタイル研究

芸術学生がゴッホのスタイル特徴を学ぶために使用

🚀 ヴァン・ゴッホ・ディフュージョン

このモデルは、映画「レヴィング・ヴィンセント」のスクリーンショットを使って微調整されたStable Diffusionモデル（v1.5ベース）です。プロンプトの先頭にトークン「lvngvncnt」を使用することで、そのスタイルを適用できます（例：「lvngvncnt, beautiful woman at sunset」）。このモデルは、Eulerサンプラー（Euler_aではない）で最適に動作します。

「files and versions」タブからckptファイルをダウンロードし、選択したWeb UIのStable Diffusionモデルフォルダに配置してください。

黄色い顔が多く表示されたり、強い青色の偏りが気に入らない場合は、それらをネガティブプロンプトに入れるだけです（例：「Yellow face, blue」）。

🚀 クイックスタート

モデルの使用方法

このモデルは他のStable Diffusionモデルと同じように使用できます。詳細については、Stable Diffusionを参照してください。

また、このモデルをONNX、MPS、および/またはFLAX/JAXにエクスポートすることもできます。

コードによる使用例

from diffusers import StableDiffusionPipeline
import torch

model_id = "dallinmackay/Van-Gogh-diffusion"
pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
pipe = pipe.to("cuda")

prompt = "lvngvncnt, beautiful woman at sunset"
image = pipe(prompt).images[0]

image.save("./sunset.png")

✨ 主な機能

映画「レヴィング・ヴィンセント」のスタイルを再現した画像生成が可能です。
プロンプトの先頭に「lvngvncnt」を付けることで、そのスタイルを適用できます。
Eulerサンプラーで最適な結果が得られます。

📦 インストール

「files and versions」タブからckptファイルをダウンロードし、選択したWeb UIのStable Diffusionモデルフォルダに配置してください。

💻 使用例

基本的な使用法

from diffusers import StableDiffusionPipeline
import torch

model_id = "dallinmackay/Van-Gogh-diffusion"
pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
pipe = pipe.to("cuda")

prompt = "lvngvncnt, beautiful woman at sunset"
image = pipe(prompt).images[0]

image.save("./sunset.png")

高度な使用法

黄色い顔や強い青色の偏りが気に入らない場合は、ネガティブプロンプトを使用します。

from diffusers import StableDiffusionPipeline
import torch

model_id = "dallinmackay/Van-Gogh-diffusion"
pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
pipe = pipe.to("cuda")

prompt = "lvngvncnt, beautiful woman at sunset"
negative_prompt = "Yellow face, blue"
image = pipe(prompt, negative_prompt=negative_prompt).images[0]

image.save("./sunset_improved.png")

🔧 技術詳細

このモデルはDreamboothを使用し、TheLastBenのcolabノートブックを用いて学習されました。

📄 ライセンス

このモデルはオープンアクセスで、誰でも利用できます。CreativeML OpenRAIL-Mライセンスにより、権利と使用方法がさらに明確に規定されています。

CreativeML OpenRAILライセンスには以下のような規定があります。

このモデルを使用して、違法または有害な出力やコンテンツを故意に生成または共有することはできません。
作者は、ユーザーが生成した出力に対して一切の権利を主張しません。ユーザーは自由にそれらを使用できますが、ライセンスに定められた規定に違反してはなりません。
ユーザーは、このモデルの重みを再配布し、商業的に使用することができます。その場合、ライセンスに記載されている同じ使用制限を含め、CreativeML OpenRAIL-Mのコピーをすべてのユーザーに共有する必要があります。ライセンス全文はこちら

このモデルで生成されたキャラクター: Character Samples 使用したプロンプトと設定: lvngvncnt, [person], highly detailed | Steps: 25, Sampler: Euler, CFG scale: 6

このモデルで生成された風景やその他の画像: Landscape Samples 使用したプロンプトと設定: lvngvncnt, [subject/setting], highly detailed | Steps: 25, Sampler: Euler, CFG scale: 6