🚀 D&Diffusion3.0 模型
本项目的 D&Diffusion3.0 是一款文本到图像的模型,它基于 Protogen 进行微调,能生成高质量的 D&D 角色图像,在大于 512x512 的分辨率下也有出色表现。
🚀 快速开始
若要下载最新版本,请获取 'D&Diffusion3.0_Protogen.ckpt' 文件。
✨ 主要特性
- 微调优化:新版本基于 Protogen 微调,效果显著。
- 高分辨率支持:在大于 512x512 的分辨率下也能出色工作。
- 丰富的种族和职业:支持多种 D&D 种族和职业的图像生成。
📚 详细文档
种族与职业
- 种族:新版本支持的种族包括 aarakocra、aasimar、air_genasi、centaur、dragonborn、drow、dwarf、earth_genasi、elf、firbolg、fire_genasi、gith、gnome、goblin、goliath、halfling、human、illithid、kenku、kobold、lizardfolk、minotaur、orc、tabaxi、thrikreen、tiefling、tortle、warforged、water_genasi。
- 职业:新版本支持的职业有 Artificer、Bard、Barbarian、Cleric、Fighter、Druid、Monk、Paladin、Rogue、Ranger、Sorcerer、Warlock、Wizard、Noble、Townsperson。
训练数据集
可在 这里 查看训练数据集的种族列表。
不同模型特点
- Model16000:使用
D&D character
作为类提示进行训练,对于 centaurs 和 aarakocra 似乎效果更好。
- Model30000:使用所有图像作为类图像进行训练,能更好地模拟委托的 D&D 角色风格,对大多数种族效果都很好,但有时在生成 aarakocra 和 centaurs 时需要调整,以避免出现鸟和马的形象。对于 tiefling,控制其角的表现可能会有困难。不同职业之间存在一些特征混淆的情况,特别是精灵耳朵和角,将
elf ears
和 horns
作为负提示似乎有助于改善。
测试提示示例
正向提示
modelshoot style, (extremely detailed CG unity 8k wallpaper), full shot body photo of the most beautiful artwork in the world, english medieval pink (dragonborn druid) witch, black silk robe, nature magic, medieval era, painting by Ed Blinkey, Atey Ghailan, Studio Ghibli, by Jeremy Mann, Greg Manchess, Antonio Moro, trending on ArtStation, trending on CGSociety, Intricate, High Detail, Sharp focus, dramatic, painting art by midjourney and greg rutkowski, teal and gold, petals, countryside, action pose, casting a spell, green swirling magic
[natural colors], full body tiefling (knight), [watercolor digital 2D painting], (strong shading), hard shadows, blurry, elegant, wearing robes, style of (saga comic) Lois van Baarle and charlie bowater and Sui Ishida, messy, disheveled, thick brushwork, detailed face and eyes, concept art
portrait (painting) of tabaxi, de Rivia closeup, suit, collar, formal attire, D&D, fantasy, intricate, elegant, highly detailed, artstation, concept art, matte, sharp focus, (brush strokes), (oil on canvas), hearthstone, art by Titian and Greg Rutkowski and Rembrandt van Rijn and Alphonse Mucha
(受 Reddit 帖子启发)
负向提示
canvas frame, cartoon, 3d, photorealistic
其他参数
- Steps:20
- Sampler:DPM++ 2M Karras
- CFG scale:10
- Seed:2603924688
- Size:512x768
- Batch size:4
- Batch pos:1
- Clip skip:2
📄 许可证
本模型采用 creativeml-openrail-m 许可证。