Emi
模型简介
由AI Picasso开发的图像生成模型,专注于动漫风格艺术创作,允许商业用途
模型特点
商业用途许可
采用Open RAIL++许可证,明确允许商业用途
合规训练数据
未使用Danbooru等网站的未经授权转载图像进行训练
动漫风格优化
特别优化了动漫风格插图的生成质量
高级硬件开发
使用H100开发设备进行训练
模型能力
动漫风格图像生成
文本到图像转换
艺术创作辅助
商业图像生成
使用案例
创意产业
插画创作辅助
为插画师提供创作灵感和初步草图
可生成符合要求的动漫风格图像
漫画制作
快速生成漫画分镜和角色设计
黑白或彩色漫画风格图像
商业应用
广告设计
生成符合品牌调性的宣传图像
可用于商业宣传的高质量图像
教育研究
AI艺术教学
用于艺术院校的AI创作课程
帮助学生理解AI艺术创作过程
🚀 Emi模型卡片
Emi(Ethereal master of illustration)是AI Picasso社利用最先进的开发器材H100和图像生成技术Stable Diffusion XL 1.0开发的一款专注于AI艺术的图像生成AI。该模型的一大特点是未使用Danbooru等平台上的未经授权转载图像进行训练。
🚀 快速开始
若要从本页面下载此模型,你需要提供在Hugging Face上注册的信息。所提供的信息将用于指导你如何使用图像生成AI。
你可以从这里使用演示。若要正式使用,可从这里下载模型。若普通版本生成效果不佳,可使用稳定版。
✨ 主要特性
- 合规训练数据:未使用Danbooru等平台上的未经授权转载图像进行训练。
- 商用许可:采用CreativeML Open RAIL++ - M License许可协议,支持商用。
📦 安装指南
ComfyUI或Fooocus
与Stable Diffusion XL 1.0的使用方法相同,请使用safetensor格式的模型文件。详细安装方法请参考这篇文章。
Diffusers
请使用🤗's Diffusers library。 首先,执行以下脚本安装库:
pip install invisible_watermark transformers accelerate safetensors diffusers
然后,执行以下脚本生成图像:
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
import torch
model_id = "aipicasso/emi"
scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionXLPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe = pipe.to("cuda")
prompt = "1girl, sunflowers, brown bob hair, brown eyes, sky, transparent"
images = pipe(prompt, num_inference_steps=20).images
images[0].save("girl.png")
复杂操作请参考演示的源代码。
💻 使用示例
基础用法
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
import torch
model_id = "aipicasso/emi"
scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionXLPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe = pipe.to("cuda")
prompt = "1girl, sunflowers, brown bob hair, brown eyes, sky, transparent"
images = pipe(prompt, num_inference_steps=20).images
images[0].save("girl.png")
高级用法
# 若要生成更具特定风格的图像,可在提示词中添加特定描述
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
import torch
model_id = "aipicasso/emi"
scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionXLPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe = pipe.to("cuda")
prompt = "anime artwork, anime style, 1girl, sunflowers, brown bob hair, brown eyes, sky, transparent"
images = pipe(prompt, num_inference_steps=20).images
images[0].save("anime_girl.png")
简单作品示例
正向提示词:anime artwork, anime style, (1girl), (black bob hair:1.5), brown eyes, red maples, sky, ((transparent))
负向提示词:(embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand
正向提示词:monochrome, black and white, (japanese manga), mount fuji
负向提示词:(embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand
正向提示词:(1man), focus, white wavy short hair, blue eyes, black shirt, white background, simple background
负向提示词:(embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand
使用FreeU节点或Web UI扩展功能,参数设置为b1 = 1.1, b2 = 1.2, s1 = 0.6, s2 = 0.4时的示例。报告
📚 详细文档
模型输出提升建议
- 若想确保生成动漫风格的插画,可在提示词开头添加“anime artwork, anime style”。
- 在提示词中加入“transparent”一词,可使生成的图像更具现代画风。
- 若绘制全身图像效果不佳,可尝试使用稳定版。
- 可用的提示词与Waifu Diffusion相同,也可按照Stable Diffusion的方式使用。
- 建议在负向提示词中使用Textual Inversion。
- 由于手部生成效果不稳定,建议与DreamShaper XL1.0等写实类模型进行合并。
- 使用ChatGPT优化提示词,可能会创作出超越自身水平的作品。
- 使用最新ComfyUI中的FreeU节点,或Web UI扩展功能,并设置参数b1 = 1.1, b2 = 1.2, s1 = 0.6, s2 = 0.4,可能会进一步提升输出效果。
模型预期用途
- 创作辅助:用于插画、漫画、动漫的创作辅助,无论商用或非商用均可。
- 沟通交流:在委托创作时,用于与创作者沟通。
- 商业服务:用于提供图像生成商业服务,但需注意对生成内容的处理。
- 自我表达:通过该AI展现个人特色。
- 研究开发:包括在Discord上使用模型进行提示词工程、微调(如DreamBooth等)、与其他模型合并;使用FID等评估模型性能;使用校验和或哈希函数检查模型与Stable Diffusion以外模型的独立性。
- 教育领域:用于美术院校学生、专科学校学生的毕业创作,大学生的毕业论文或课题作业,以及教师传授图像生成AI现状。
- Hugging Face社区用途:可使用日语或英语提问。
模型非预期用途
- 不应将生成的内容用于事实表述。
- 避免做出让教师困扰的行为。
- 不得对创作行业造成负面影响。
禁止使用或恶意用途
- 不得用于资金洗钱。
- 不得公开数字赝品(Digital Forgery),以免违反著作权法。
- 不得未经授权对他人作品进行Image - to - Image操作,以免违反著作权法。
- 不得传播淫秽物品,以免违反刑法175条。
- 不得传播不实信息,以免触犯威力业务妨害罪。
模型局限性和偏差
- 模型局限性:扩散模型和大规模语言模型仍有许多未知之处,其局限性尚未明确。
- 偏差:扩散模型和大规模语言模型仍有许多未知之处,偏差情况尚未明确。
训练相关
训练数据:
- 手动收集约2000张图像,这些图像是从与Stable Diffusion相同的数据集中去除Danbooru上的未经授权转载图像后得到的。
- 自动收集约50万张图像,同样是从与Stable Diffusion相同的数据集中去除Danbooru上的未经授权转载图像后得到的。
训练过程:
- 硬件:H100
评估结果
正在寻求第三方评估。
环境影响
- 硬件类型:H100
- 使用时间(单位:小时):500
- 训练地点:日本
法律相关
本模型在日本创建,因此适用日本法律。本模型的训练基于著作权法第30条之4,主张合法。同时,本模型的分发在著作权法和刑法175条的框架下,主张不构成正犯或帮助犯。详情请参考柿沼律师的见解。但请按照许可证规定,依法处理本模型的生成内容。
联系信息
support@aipicasso.app
模型详细信息
属性 | 详情 |
---|---|
模型类型 | 基于扩散模型的文本到图像生成模型 |
语言 | 日语 |
许可证 | CreativeML Open RAIL++-M License |
模型说明 | 该模型可根据提示生成合适的图像。算法采用 Latent Diffusion Model、OpenCLIP-ViT/G 和 CLIP-L。 |
参考文献 |
|
📄 许可证
本模型采用CreativeML Open RAIL++ - M License许可协议,因此可用于商业用途。做出此决定的原因如下:
- 随着图像生成AI的普及,越来越多的人开始遵守创作规范,以避免对创作行业造成负面影响。
- 鉴于其他图像生成AI已支持商用,非商用许可证的实际效力逐渐降低。
Stable Diffusion V1 5
Openrail
稳定扩散是一种潜在的文本到图像扩散模型,能够根据任何文本输入生成逼真的图像。
图像生成
S
stable-diffusion-v1-5
3.7M
518
Stable Diffusion Inpainting
Openrail
基于稳定扩散的文本到图像生成模型,具备图像修复能力
图像生成
S
stable-diffusion-v1-5
3.3M
56
Stable Diffusion Xl Base 1.0
SDXL 1.0是基于扩散的文本生成图像模型,采用专家集成的潜在扩散流程,支持高分辨率图像生成
图像生成
S
stabilityai
2.4M
6,545
Stable Diffusion V1 4
Openrail
稳定扩散是一种潜在文本到图像扩散模型,能够根据任意文本输入生成逼真图像。
图像生成
S
CompVis
1.7M
6,778
Stable Diffusion Xl Refiner 1.0
SD-XL 1.0优化器模型是Stability AI开发的图像生成模型,专为提升SDXL基础模型生成的图像质量而设计,特别擅长最终去噪步骤处理。
图像生成
S
stabilityai
1.1M
1,882
Stable Diffusion 2 1
基于扩散的文本生成图像模型,支持通过文本提示生成和修改图像
图像生成
S
stabilityai
948.75k
3,966
Stable Diffusion Xl 1.0 Inpainting 0.1
基于Stable Diffusion XL的潜在文本到图像扩散模型,具备通过遮罩进行图像修复的功能
图像生成
S
diffusers
673.14k
334
Stable Diffusion 2 Base
基于扩散的文生图模型,可根据文本提示生成高质量图像
图像生成
S
stabilityai
613.60k
349
Playground V2.5 1024px Aesthetic
其他
开源文生图模型,能生成1024x1024分辨率及多种纵横比的美学图像,在美学质量上处于开源领域领先地位。
图像生成
P
playgroundai
554.94k
723
Sd Turbo
SD-Turbo是一款高速文本生成图像模型,仅需单次网络推理即可根据文本提示生成逼真图像。该模型作为研究原型发布,旨在探索小型蒸馏文本生成图像模型。
图像生成
S
stabilityai
502.82k
380
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98