🚀 索莫夫的狂歡節風格LoRA模型
本項目是一個用於圖像生成的低秩適配器(LoRA)模型,它基於FLUX系列模型進行微調,能夠生成具有康斯坦丁·索莫夫(Konstantin Somov)風格的藝術作品。該模型受到18世紀夢幻般的玩具月光、皮埃羅的蕾絲淚滴、 Columbina的綢緞喘息和丑角的天鵝絨舞步等元素的啟發,為用戶帶來獨特的藝術體驗。
🚀 快速開始
依賴安裝
你可以使用以下代碼加載模型並生成圖像:
from diffusers import AutoPipelineForText2Image
import torch
pipeline = AutoPipelineForText2Image.from_pretrained('black-forest-labs/FLUX.1-dev', torch_dtype=torch.float16).to('cuda')
pipeline.load_lora_weights('AlekseyCalvin/Somov_Carnivalesques_V1_FluxLoRA_BySilverAgePoets')
image = pipeline('your prompt').images[0]
提示詞示例
在生成圖像時,你可以使用以下提示詞:
Somov style art, artwork by Konstantin Somov, detailed carnivalesque illustration
示例輸出

✨ 主要特性
- 獨特藝術風格:該模型能夠生成具有康斯坦丁·索莫夫風格的藝術作品,展現出18世紀狂歡節的獨特魅力。
- 多版本支持:提供了兩種不同的檢查點版本(Variant I和Variant II),用戶可以根據自己的需求進行選擇。
- 靈活的提示詞:用戶可以通過調整提示詞來生成不同主題和風格的圖像。
📦 安裝指南
環境要求
- Python 3.6+
- PyTorch 1.7+
- diffusers庫
安裝步驟
- 安裝必要的庫:
pip install diffusers torch
- 按照快速開始部分的代碼加載模型。
💻 使用示例
基礎用法
from diffusers import AutoPipelineForText2Image
import torch
pipeline = AutoPipelineForText2Image.from_pretrained('black-forest-labs/FLUX.1-dev', torch_dtype=torch.float16).to('cuda')
pipeline.load_lora_weights('AlekseyCalvin/Somov_Carnivalesques_V1_FluxLoRA_BySilverAgePoets')
prompt = 'Somov style art, artwork by Konstantin Somov, detailed carnivalesque illustration'
image = pipeline(prompt).images[0]
image.save('output.png')
高級用法
你可以嘗試不同的提示詞來生成不同風格的圖像,例如:
prompt = 'Somov style art, artwork by Konstantin Somov, detailed carnivalesque illustration of Arthur Rimbaud, the revolutionary blonde messy haired teenage trans man poet delivering a lecture to parlor book club group of revolutionary poet cat-person hermaphrodite angels circa the 1870s'
image = pipeline(prompt).images[0]
image.save('advanced_output.png')
📚 詳細文檔
模型版本說明
超參數說明
該模型在大約130張圖像上進行微調,這些圖像從我們整理的300多張索莫夫藝術文件中挑選出來,並經過手動預處理和修復。在微調過程中,我們使用了以下超參數:
屬性 |
詳情 |
模型類型 |
低秩適配器(LoRA) |
訓練數據 |
約130張受康斯坦丁·索莫夫啟發的藝術作品 |
維度 |
64dim |
Alpha值 |
128alpha(Variant I);64alpha(Variant II) |
優化器 |
Adamw8bit |
學習率 |
0.0005 |
EMA |
無 |
時間步長 |
線性時間步長(FALSE) |
配置 |
FluxCFG |
分辨率 |
768 |
批次大小 |
1 |
訓練設備 |
單個L4(通過Google Colab Pro) |
由於數據集的大小,我們不得不將分辨率限制為768,因為即使是1024的分辨率也會導致內存不足錯誤,有時在訓練的早期階段就會出現這種情況。
🔧 技術細節
該模型是一個基於FLUX系列的低秩適配器(LoRA),通過微調來學習康斯坦丁·索莫夫的藝術風格。在微調過程中,我們使用了特定的基礎模型和CLIP模型,並對不同版本的檢查點進行了不同的超參數設置。具體來說,我們在大約130張經過精心挑選和預處理的藝術作品上進行訓練,以確保模型能夠學習到索莫夫風格的細節和特點。
📄 許可證
本項目採用Apache-2.0許可證。