cool-japan-diffusion-2-1-0開源模型 - 免費生成含日本動漫文化元素的圖像

首頁

Cool Japan Diffusion 2 1 0

由aipicasso開發

基於Stable Diffusion微調的動漫風格圖像生成模型，專注於表現日本動漫、漫畫、遊戲等文化元素

圖像生成開源協議:其他 #動漫風格生成 #日本文化特化 #非商業限制

下載量 37

發布時間 : 12/29/2022

模型概述

Cool Japan Diffusion是基於Stable Diffusion微調的文本生成圖像模型，專門針對動漫、漫畫、遊戲等日本流行文化內容進行優化，能夠生成高質量的動漫風格圖像。

模型特點

日本動漫風格優化

專門針對動漫、漫畫、遊戲等日本流行文化內容進行訓練和優化

高質量圖像生成

能夠生成4K高清質量的動漫風格圖像

倫理與法律合規

模型開發考慮了日本法律和倫理問題，提供明確的使用指南

模型能力

動漫風格圖像生成

文本到圖像轉換

高質量藝術創作

文化內容表達

使用案例

藝術創作

動漫角色設計

生成原創動漫角色肖像

高質量動漫風格角色圖像

插畫創作

根據文本描述生成完整插畫

4K高清全綵插畫

文化推廣

日本文化展示

生成代表日本文化的視覺內容

具有日本特色的高質量圖像

教育研究

AI藝術教學

用於藝術院校的AI技術教學

幫助學生理解AI藝術創作原理

🚀 酷日本擴散2.1.0模型卡片

酷日本擴散2.1.0模型是基於Stable Diffusion進行微調的模型，專注於呈現動漫、漫畫、遊戲等酷日本風格的圖像生成，為相關創作和研究提供了有力支持。

⚠️ 重要提示

注意事項。從2023年1月10日起，中國將對圖像生成的人工智能實施法律限制。（此為對中國國內用戶的警告）

英文版本請見這裡。

🚀 快速開始

手軽に楽しみたい方は、こちらのSpaceをお使いください。詳しい本モデルの取り扱い方はこちらの取扱説明書にかかれています。モデルはここからダウンロードできます。

✨ 主要特性

Cool Japan Diffusion (for learning) 是對Stable Diffsion進行微調後，專門用於表現動漫、漫畫、遊戲等酷日本風格的模型。不過，它與內閣府的酷日本戰略並無特別關聯。

📦 安裝指南

Diffusers安裝

首先，執行以下腳本安裝所需庫：

pip install --upgrade git+https://github.com/huggingface/diffusers.git transformers accelerate scipy

💻 使用示例

基礎用法

使用Diffusers庫生成圖像的示例代碼如下：

from diffusers import StableDiffusionPipeline, EulerDiscreteScheduler
import torch

model_id = "aipicasso/cool-japan-diffusion-2-1-0-beta"

scheduler = EulerDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe = pipe.to("cuda")

prompt = "anime, a portrait of a girl with black short hair and red eyes, kimono, full color illustration, official art, 4k, detailed"
negative_prompt="low quality, bad face, bad anatomy, bad hand, lowres, jpeg artifacts, 2d, 3d, cg, text"
image = pipe(prompt,negative_prompt=negative_prompt).images[0]

image.save("girl.png")

💡 使用建議

xformers を使うと早くなるらしいです。

GPUを使う際にGPUのメモリが少ない人は pipe.enable_attention_slicing() を使ってください。

📚 詳細文檔

模型詳情

屬性	詳情
開發者	Robin Rombach, Patrick Esser, Alfred Increment
模型類型	基於擴散模型的文本到圖像生成模型
語言	日本語
許可證	CreativeML Open RAIL++-M-NC License
模型說明	該模型能夠根據提示生成合適的圖像。算法採用 Latent Diffusion Model 和 OpenCLIP-ViT/H
參考文獻	@InProceedings{Rombach_2022_CVPR, author = {Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bj"orn}, title = {High-Resolution Image Synthesis With Latent Diffusion Models}, booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, month = {June}, year = {2022}, pages = {10684-10695} }

模型使用場景

預期用途

競賽：可向 AIアートグランプリ投稿，但需公開微調所用的所有數據，並確保符合審查標準，提前申請並獲得確認。如有需求，可在Hugging Face的社區等渠道告知作者。
圖像生成AI相關報道：無論是公共廣播還是營利企業都可以進行相關報道，因為認為圖像合成AI的信息“知情權”不會對創作界造成負面影響，同時尊重報道自由。
酷日本介紹：向其他國家的人介紹酷日本的概念。很多外國留學生因酷日本而來到日本，但常常會因發現日本的酷日本形象與預期不符而感到失望，希望大家能更加自豪地展示本國文化。
研發：可在Discord上使用該模型進行提示工程、微調（如DreamBooth等）、與其他模型合併等操作；研究Latent Diffusion Model與酷日本的適配性；使用FID等評估模型性能；通過校驗和或哈希函數檢查該模型是否獨立於Stable Diffusion以外的模型。
教育：可用於美術生、專科學校學生的畢業作品，大學生的畢業論文或課題製作，以及教師向學生介紹圖像生成AI的現狀。
自我表達：在SNS上表達自己的情感和想法。
Hugging Face社區用途：可使用日語或英語在社區提問。

非預期用途

不應用於將事物表述為事實的場景。
不得用於有收益的YouTube等內容。
不能直接作為商業服務提供。
不應給教師帶來困擾。
避免對創作界造成負面影響。

禁止使用場景

請勿公開數字贗品 (Digital Forgery)，否則可能違反著作權法。尤其不要公開現有角色的生成圖像，不過未學習過的角色也能生成（此推文僅用於研究目的）。
請勿未經他人許可對其作品進行Image-to-Image操作，否則可能違反著作權法。
請勿傳播淫穢物品，否則可能違反刑法175條。同時要遵守行業規範。
不要將沒有事實依據的事情當作事實來講述，否則可能適用威力業務妨害罪，即避免傳播虛假新聞。