Emi
模型概述
由AI Picasso開發的圖像生成模型,專注於動漫風格藝術創作,允許商業用途
模型特點
商業用途許可
採用Open RAIL++許可證,明確允許商業用途
合規訓練數據
未使用Danbooru等網站的未經授權轉載圖像進行訓練
動漫風格優化
特別優化了動漫風格插圖的生成質量
高級硬件開發
使用H100開發設備進行訓練
模型能力
動漫風格圖像生成
文本到圖像轉換
藝術創作輔助
商業圖像生成
使用案例
創意產業
插畫創作輔助
為插畫師提供創作靈感和初步草圖
可生成符合要求的動漫風格圖像
漫畫製作
快速生成漫畫分鏡和角色設計
黑白或彩色漫畫風格圖像
商業應用
廣告設計
生成符合品牌調性的宣傳圖像
可用於商業宣傳的高質量圖像
教育研究
AI藝術教學
用於藝術院校的AI創作課程
幫助學生理解AI藝術創作過程
🚀 Emi模型卡片
Emi(Ethereal master of illustration)是AI Picasso社利用最先進的開發器材H100和圖像生成技術Stable Diffusion XL 1.0開發的一款專注於AI藝術的圖像生成AI。該模型的一大特點是未使用Danbooru等平臺上的未經授權轉載圖像進行訓練。
🚀 快速開始
若要從本頁面下載此模型,你需要提供在Hugging Face上註冊的信息。所提供的信息將用於指導你如何使用圖像生成AI。
你可以從這裡使用演示。若要正式使用,可從這裡下載模型。若普通版本生成效果不佳,可使用穩定版。
✨ 主要特性
- 合規訓練數據:未使用Danbooru等平臺上的未經授權轉載圖像進行訓練。
- 商用許可:採用CreativeML Open RAIL++ - M License許可協議,支持商用。
📦 安裝指南
ComfyUI或Fooocus
與Stable Diffusion XL 1.0的使用方法相同,請使用safetensor格式的模型文件。詳細安裝方法請參考這篇文章。
Diffusers
請使用🤗's Diffusers library。 首先,執行以下腳本安裝庫:
pip install invisible_watermark transformers accelerate safetensors diffusers
然後,執行以下腳本生成圖像:
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
import torch
model_id = "aipicasso/emi"
scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionXLPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe = pipe.to("cuda")
prompt = "1girl, sunflowers, brown bob hair, brown eyes, sky, transparent"
images = pipe(prompt, num_inference_steps=20).images
images[0].save("girl.png")
複雜操作請參考演示的源代碼。
💻 使用示例
基礎用法
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
import torch
model_id = "aipicasso/emi"
scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionXLPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe = pipe.to("cuda")
prompt = "1girl, sunflowers, brown bob hair, brown eyes, sky, transparent"
images = pipe(prompt, num_inference_steps=20).images
images[0].save("girl.png")
高級用法
# 若要生成更具特定風格的圖像,可在提示詞中添加特定描述
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
import torch
model_id = "aipicasso/emi"
scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionXLPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe = pipe.to("cuda")
prompt = "anime artwork, anime style, 1girl, sunflowers, brown bob hair, brown eyes, sky, transparent"
images = pipe(prompt, num_inference_steps=20).images
images[0].save("anime_girl.png")
簡單作品示例
正向提示詞:anime artwork, anime style, (1girl), (black bob hair:1.5), brown eyes, red maples, sky, ((transparent))
負向提示詞:(embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand
正向提示詞:monochrome, black and white, (japanese manga), mount fuji
負向提示詞:(embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand
正向提示詞:(1man), focus, white wavy short hair, blue eyes, black shirt, white background, simple background
負向提示詞:(embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand
使用FreeU節點或Web UI擴展功能,參數設置為b1 = 1.1, b2 = 1.2, s1 = 0.6, s2 = 0.4時的示例。報告
📚 詳細文檔
模型輸出提升建議
- 若想確保生成動漫風格的插畫,可在提示詞開頭添加“anime artwork, anime style”。
- 在提示詞中加入“transparent”一詞,可使生成的圖像更具現代畫風。
- 若繪製全身圖像效果不佳,可嘗試使用穩定版。
- 可用的提示詞與Waifu Diffusion相同,也可按照Stable Diffusion的方式使用。
- 建議在負向提示詞中使用Textual Inversion。
- 由於手部生成效果不穩定,建議與DreamShaper XL1.0等寫實類模型進行合併。
- 使用ChatGPT優化提示詞,可能會創作出超越自身水平的作品。
- 使用最新ComfyUI中的FreeU節點,或Web UI擴展功能,並設置參數b1 = 1.1, b2 = 1.2, s1 = 0.6, s2 = 0.4,可能會進一步提升輸出效果。
模型預期用途
- 創作輔助:用於插畫、漫畫、動漫的創作輔助,無論商用或非商用均可。
- 溝通交流:在委託創作時,用於與創作者溝通。
- 商業服務:用於提供圖像生成商業服務,但需注意對生成內容的處理。
- 自我表達:通過該AI展現個人特色。
- 研究開發:包括在Discord上使用模型進行提示詞工程、微調(如DreamBooth等)、與其他模型合併;使用FID等評估模型性能;使用校驗和或哈希函數檢查模型與Stable Diffusion以外模型的獨立性。
- 教育領域:用於美術院校學生、專科學校學生的畢業創作,大學生的畢業論文或課題作業,以及教師傳授圖像生成AI現狀。
- Hugging Face社區用途:可使用日語或英語提問。
模型非預期用途
- 不應將生成的內容用於事實表述。
- 避免做出讓教師困擾的行為。
- 不得對創作行業造成負面影響。
禁止使用或惡意用途
- 不得用於資金洗錢。
- 不得公開數字贗品(Digital Forgery),以免違反著作權法。
- 不得未經授權對他人作品進行Image - to - Image操作,以免違反著作權法。
- 不得傳播淫穢物品,以免違反刑法175條。
- 不得傳播不實信息,以免觸犯威力業務妨害罪。
模型侷限性和偏差
- 模型侷限性:擴散模型和大規模語言模型仍有許多未知之處,其侷限性尚未明確。
- 偏差:擴散模型和大規模語言模型仍有許多未知之處,偏差情況尚未明確。
訓練相關
訓練數據:
- 手動收集約2000張圖像,這些圖像是從與Stable Diffusion相同的數據集中去除Danbooru上的未經授權轉載圖像後得到的。
- 自動收集約50萬張圖像,同樣是從與Stable Diffusion相同的數據集中去除Danbooru上的未經授權轉載圖像後得到的。
訓練過程:
- 硬件:H100
評估結果
正在尋求第三方評估。
環境影響
- 硬件類型:H100
- 使用時間(單位:小時):500
- 訓練地點:日本
法律相關
本模型在日本創建,因此適用日本法律。本模型的訓練基於著作權法第30條之4,主張合法。同時,本模型的分發在著作權法和刑法175條的框架下,主張不構成正犯或幫助犯。詳情請參考柿沼律師的見解。但請按照許可證規定,依法處理本模型的生成內容。
聯繫信息
support@aipicasso.app
模型詳細信息
屬性 | 詳情 |
---|---|
模型類型 | 基於擴散模型的文本到圖像生成模型 |
語言 | 日語 |
許可證 | CreativeML Open RAIL++-M License |
模型說明 | 該模型可根據提示生成合適的圖像。算法採用 Latent Diffusion Model、OpenCLIP-ViT/G 和 CLIP-L。 |
參考文獻 |
|
📄 許可證
本模型採用CreativeML Open RAIL++ - M License許可協議,因此可用於商業用途。做出此決定的原因如下:
- 隨著圖像生成AI的普及,越來越多的人開始遵守創作規範,以避免對創作行業造成負面影響。
- 鑑於其他圖像生成AI已支持商用,非商用許可證的實際效力逐漸降低。
Stable Diffusion V1 5
Openrail
穩定擴散是一種潛在的文本到圖像擴散模型,能夠根據任何文本輸入生成逼真的圖像。
圖像生成
S
stable-diffusion-v1-5
3.7M
518
Stable Diffusion Inpainting
Openrail
基於穩定擴散的文本到圖像生成模型,具備圖像修復能力
圖像生成
S
stable-diffusion-v1-5
3.3M
56
Stable Diffusion Xl Base 1.0
SDXL 1.0是基於擴散的文本生成圖像模型,採用專家集成的潛在擴散流程,支持高分辨率圖像生成
圖像生成
S
stabilityai
2.4M
6,545
Stable Diffusion V1 4
Openrail
穩定擴散是一種潛在文本到圖像擴散模型,能夠根據任意文本輸入生成逼真圖像。
圖像生成
S
CompVis
1.7M
6,778
Stable Diffusion Xl Refiner 1.0
SD-XL 1.0優化器模型是Stability AI開發的圖像生成模型,專為提升SDXL基礎模型生成的圖像質量而設計,特別擅長最終去噪步驟處理。
圖像生成
S
stabilityai
1.1M
1,882
Stable Diffusion 2 1
基於擴散的文本生成圖像模型,支持通過文本提示生成和修改圖像
圖像生成
S
stabilityai
948.75k
3,966
Stable Diffusion Xl 1.0 Inpainting 0.1
基於Stable Diffusion XL的潛在文本到圖像擴散模型,具備通過遮罩進行圖像修復的功能
圖像生成
S
diffusers
673.14k
334
Stable Diffusion 2 Base
基於擴散的文生圖模型,可根據文本提示生成高質量圖像
圖像生成
S
stabilityai
613.60k
349
Playground V2.5 1024px Aesthetic
其他
開源文生圖模型,能生成1024x1024分辨率及多種縱橫比的美學圖像,在美學質量上處於開源領域領先地位。
圖像生成
P
playgroundai
554.94k
723
Sd Turbo
SD-Turbo是一款高速文本生成圖像模型,僅需單次網絡推理即可根據文本提示生成逼真圖像。該模型作為研究原型發佈,旨在探索小型蒸餾文本生成圖像模型。
圖像生成
S
stabilityai
502.82k
380
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98