🚀 D&Diffusion3.0 模型
本項目的 D&Diffusion3.0 是一款文本到圖像的模型,它基於 Protogen 進行微調,能生成高質量的 D&D 角色圖像,在大於 512x512 的分辨率下也有出色表現。
🚀 快速開始
若要下載最新版本,請獲取 'D&Diffusion3.0_Protogen.ckpt' 文件。
✨ 主要特性
- 微調優化:新版本基於 Protogen 微調,效果顯著。
- 高分辨率支持:在大於 512x512 的分辨率下也能出色工作。
- 豐富的種族和職業:支持多種 D&D 種族和職業的圖像生成。
📚 詳細文檔
種族與職業
- 種族:新版本支持的種族包括 aarakocra、aasimar、air_genasi、centaur、dragonborn、drow、dwarf、earth_genasi、elf、firbolg、fire_genasi、gith、gnome、goblin、goliath、halfling、human、illithid、kenku、kobold、lizardfolk、minotaur、orc、tabaxi、thrikreen、tiefling、tortle、warforged、water_genasi。
- 職業:新版本支持的職業有 Artificer、Bard、Barbarian、Cleric、Fighter、Druid、Monk、Paladin、Rogue、Ranger、Sorcerer、Warlock、Wizard、Noble、Townsperson。
訓練數據集
可在 這裡 查看訓練數據集的種族列表。
不同模型特點
- Model16000:使用
D&D character
作為類提示進行訓練,對於 centaurs 和 aarakocra 似乎效果更好。
- Model30000:使用所有圖像作為類圖像進行訓練,能更好地模擬委託的 D&D 角色風格,對大多數種族效果都很好,但有時在生成 aarakocra 和 centaurs 時需要調整,以避免出現鳥和馬的形象。對於 tiefling,控制其角的表現可能會有困難。不同職業之間存在一些特徵混淆的情況,特別是精靈耳朵和角,將
elf ears
和 horns
作為負提示似乎有助於改善。
測試提示示例
正向提示
modelshoot style, (extremely detailed CG unity 8k wallpaper), full shot body photo of the most beautiful artwork in the world, english medieval pink (dragonborn druid) witch, black silk robe, nature magic, medieval era, painting by Ed Blinkey, Atey Ghailan, Studio Ghibli, by Jeremy Mann, Greg Manchess, Antonio Moro, trending on ArtStation, trending on CGSociety, Intricate, High Detail, Sharp focus, dramatic, painting art by midjourney and greg rutkowski, teal and gold, petals, countryside, action pose, casting a spell, green swirling magic
[natural colors], full body tiefling (knight), [watercolor digital 2D painting], (strong shading), hard shadows, blurry, elegant, wearing robes, style of (saga comic) Lois van Baarle and charlie bowater and Sui Ishida, messy, disheveled, thick brushwork, detailed face and eyes, concept art
portrait (painting) of tabaxi, de Rivia closeup, suit, collar, formal attire, D&D, fantasy, intricate, elegant, highly detailed, artstation, concept art, matte, sharp focus, (brush strokes), (oil on canvas), hearthstone, art by Titian and Greg Rutkowski and Rembrandt van Rijn and Alphonse Mucha
(受 Reddit 帖子啟發)
負向提示
canvas frame, cartoon, 3d, photorealistic
其他參數
- Steps:20
- Sampler:DPM++ 2M Karras
- CFG scale:10
- Seed:2603924688
- Size:512x768
- Batch size:4
- Batch pos:1
- Clip skip:2
📄 許可證
本模型採用 creativeml-openrail-m 許可證。