Segmoe SD 4x2 V0
SegMoE-SD-4x2-v0是基于4个SD1.5专家模型通过segmoe框架生成的未训练Segmind扩散专家混合模型,支持文本生成图像任务,具有超现实风格。
下载量 1,562
发布时间 : 1/29/2024
模型简介
该模型是一个能在几分钟内动态组合多个稳定扩散模型形成专家混合体的强大框架,无需训练即可实现。支持即时创建更大规模的模型,从而提供更丰富的知识、更高的遵循度和更优的图像质量。
模型特点
无需训练的专家混合
通过segmoe框架动态组合多个稳定扩散模型,无需训练即可形成专家混合体。
多专家知识集成
集成多个精调专家模型的知识,提供更丰富的图像生成能力。
即时模型扩展
支持即时创建更大规模的模型,提升图像质量和遵循度。
模型能力
文本生成图像
超现实风格图像生成
多风格图像生成
使用案例
创意艺术
超现实艺术创作
生成具有超现实风格的创意艺术作品。
示例图片展示了宇宙画布和橙色城市背景的胖猫绘画。
概念设计
概念艺术生成
用于游戏、电影等领域的快速概念艺术生成。
🚀 SegMoE-SD-4x2-v0:Segmind扩散专家混合模型
SegMoE-SD-4x2-v0是一个基于Segmind的扩散专家混合模型,它利用segmoe框架,从4个SD1.5专家模型生成,无需训练。SegMoE是一个强大的框架,可在几分钟内将多个Stable Diffusion模型动态组合成一个专家混合模型,无需训练。该框架允许即时创建更大的模型,这些模型具有更广泛的知识、更好的一致性和更高的图像质量。
🚀 快速开始
本模型可以通过 segmoe 库使用。
安装segmoe
请确保通过以下命令安装 segmoe:
pip install segmoe
使用示例代码
from segmoe import SegMoEPipeline
pipeline = SegMoEPipeline("segmind/SegMoE-SD-4x2-v0", device = "cuda")
prompt = "cosmic canvas, orange city background, painting of a chubby cat"
negative_prompt = "nsfw, bad quality, worse quality"
img = pipeline(
prompt=prompt,
negative_prompt=negative_prompt,
height=1024,
width=1024,
num_inference_steps=25,
guidance_scale=7.5,
).images[0]
img.save("image.png")
✨ 主要特性
- 融合多专家知识:受益于多个微调专家模型的知识。
- 无需训练:无需额外的训练过程。
- 更好的数据适应性:对数据有更好的适应性。
- 模型可升级:可以通过使用更好的微调模型作为专家之一来升级模型。
📦 安装指南
确保通过以下命令安装 segmoe
库:
pip install segmoe
💻 使用示例
基础用法
from segmoe import SegMoEPipeline
pipeline = SegMoEPipeline("segmind/SegMoE-SD-4x2-v0", device = "cuda")
prompt = "cosmic canvas, orange city background, painting of a chubby cat"
negative_prompt = "nsfw, bad quality, worse quality"
img = pipeline(
prompt=prompt,
negative_prompt=negative_prompt,
height=1024,
width=1024,
num_inference_steps=25,
guidance_scale=7.5,
).images[0]
img.save("image.png")
📚 详细文档
配置信息
用于创建此模型的配置如下:
base_model: SG161222/Realistic_Vision_V6.0_B1_noVAE
num_experts: 4
moe_layers: all
num_experts_per_tok: 2
experts:
- source_model: SG161222/Realistic_Vision_V6.0_B1_noVAE
positive_prompt: "cinematic, portrait, photograph, instagram, fashion, movie, macro shot, 8K, RAW, hyperrealistic, ultra realistic,"
negative_prompt: " (deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime), text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck"
- source_model: dreamlike-art/dreamlike-anime-1.0
positive_prompt: "photo anime, masterpiece, high quality, absurdres, 1girl, 1boy, waifu, chibi"
negative_prompt: "simple background, duplicate, retro style, low quality, lowest quality, 1980s, 1990s, 2000s, 2005 2006 2007 2008 2009 2010 2011 2012 2013, bad anatomy, bad proportions, extra digits, lowres, username, artist name, error, duplicate, watermark, signature, text, extra digit, fewer digits, worst quality, jpeg artifacts, blurry"
- source_model: Lykon/dreamshaper-8
positive_prompt: "bokeh, intricate, elegant, sharp focus, soft lighting, vibrant colors, dreamlike, fantasy, artstation, concept art"
negative_prompt: "low quality, lowres, jpeg artifacts, signature, bad anatomy, extra legs, extra arms, extra fingers, poorly drawn hands, poorly drawn feet, disfigured, out of frame, tiling, bad art, deformed, mutated, blurry, fuzzy, misshaped, mutant, gross, disgusting, ugly, watermark, watermarks"
- source_model: dreamlike-art/dreamlike-diffusion-1.0
positive_prompt: "dreamlikeart, a grungy woman with rainbow hair, travelling between dimensions, dynamic pose, happy, soft eyes and narrow chin, extreme bokeh, dainty figure, long hair straight down, torn kawaii shirt and baggy jeans, In style of by Jordan Grimmer and greg rutkowski, crisp lines and color, complex background, particles, lines, wind, concept art, sharp focus, vivid colors"
negative_prompt: "nude, naked, low quality, lowres, jpeg artifacts, signature, bad anatomy, extra legs, extra arms, extra fingers, poorly drawn hands, poorly drawn feet, disfigured, out of frame"
其他变体
我们在Hugging Face上发布了3个合并模型:
- SegMoE 4x2:包含四个Stable Diffusion XL专家模型。
- SegMoE 2x1:包含两个Stable Diffusion XL专家模型。
模型描述
属性 | 详情 |
---|---|
开发团队 | Segmind |
开发者 | Yatharth Gupta 和 Vishnu Jaddipal |
模型类型 | 基于扩散的文本到图像生成的专家混合模型 |
许可证 | Apache 2.0 |
适用范围外的使用
SegMoE-SD-4x2-v0模型不适用于创建人物、事件或现实世界信息的事实性或准确表示。它不适合需要高精度和准确性的任务。
🔧 技术细节
优点
- 受益于多个微调专家模型的知识。
- 无需训练。
- 对数据有更好的适应性。
- 可以通过使用更好的微调模型作为专家之一来升级模型。
局限性
- 尽管该模型在图像保真度和一致性方面有所改进,但在未训练的情况下,它并不比任何一个专家模型有显著的提升,并且依赖于专家模型的知识。
- 该模型尚未针对速度进行优化。
- 该框架尚未针对内存使用进行优化。
📄 许可证
本模型使用 Apache 2.0 许可证。
📖 引用
@misc{segmoe,
author = {Yatharth Gupta, Vishnu V Jaddipal, Harish Prabhala},
title = {SegMoE},
year = {2024},
publisher = {HuggingFace},
journal = {HuggingFace Models},
howpublished = {\url{https://huggingface.co/segmind/SegMoE-SD-4x2-v0}}
}
Stable Diffusion V1 5
Openrail
稳定扩散是一种潜在的文本到图像扩散模型,能够根据任何文本输入生成逼真的图像。
图像生成
S
stable-diffusion-v1-5
3.7M
518
Stable Diffusion Inpainting
Openrail
基于稳定扩散的文本到图像生成模型,具备图像修复能力
图像生成
S
stable-diffusion-v1-5
3.3M
56
Stable Diffusion Xl Base 1.0
SDXL 1.0是基于扩散的文本生成图像模型,采用专家集成的潜在扩散流程,支持高分辨率图像生成
图像生成
S
stabilityai
2.4M
6,545
Stable Diffusion V1 4
Openrail
稳定扩散是一种潜在文本到图像扩散模型,能够根据任意文本输入生成逼真图像。
图像生成
S
CompVis
1.7M
6,778
Stable Diffusion Xl Refiner 1.0
SD-XL 1.0优化器模型是Stability AI开发的图像生成模型,专为提升SDXL基础模型生成的图像质量而设计,特别擅长最终去噪步骤处理。
图像生成
S
stabilityai
1.1M
1,882
Stable Diffusion 2 1
基于扩散的文本生成图像模型,支持通过文本提示生成和修改图像
图像生成
S
stabilityai
948.75k
3,966
Stable Diffusion Xl 1.0 Inpainting 0.1
基于Stable Diffusion XL的潜在文本到图像扩散模型,具备通过遮罩进行图像修复的功能
图像生成
S
diffusers
673.14k
334
Stable Diffusion 2 Base
基于扩散的文生图模型,可根据文本提示生成高质量图像
图像生成
S
stabilityai
613.60k
349
Playground V2.5 1024px Aesthetic
其他
开源文生图模型,能生成1024x1024分辨率及多种纵横比的美学图像,在美学质量上处于开源领域领先地位。
图像生成
P
playgroundai
554.94k
723
Sd Turbo
SD-Turbo是一款高速文本生成图像模型,仅需单次网络推理即可根据文本提示生成逼真图像。该模型作为研究原型发布,旨在探索小型蒸馏文本生成图像模型。
图像生成
S
stabilityai
502.82k
380
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98