🚀 PosterCraft:在統一框架中重新思考高質量美學海報生成
PosterCraft是一個用於高質量美學海報生成的統一框架,它在精確文本渲染、抽象藝術無縫融合、醒目佈局和風格協調方面表現出色,為海報設計帶來了新的解決方案和價值。
🚀 快速開始
📦 安裝指南
git clone https://github.com/ephemeral182/PosterCraft.git
cd PosterCraft
conda create -n postercraft python=3.11
conda activate postercraft
pip install -r requirements.txt
💻 使用示例
基礎用法
import torch
from diffusers import FluxPipeline, FluxTransformer2DModel
pipeline_id = "black-forest-labs/FLUX.1-dev"
postercraft_transformer_id = "PosterCraft/PosterCraft-v1_RL"
device = "cuda"
dtype = torch.bfloat16
pipe = FluxPipeline.from_pretrained(pipeline_id, torch_dtype=dtype)
pipe.transformer = FluxTransformer2DModel.from_pretrained(
postercraft_transformer_id,
torch_dtype=dtype
)
pipe.to(device)
快速生成
為了獲得最佳效果並利用我們的智能提示重寫功能,我們建議使用提供的 inference.py
腳本。該腳本會自動優化你的創意想法以獲得最佳效果。
使用 BF16
精度從你的提示生成高質量美學海報,請參考我們的 GitHub倉庫:
python inference.py \
--prompt "Urban Canvas Street Art Expo poster with bold graffiti-style lettering and dynamic colorful splashes" \
--enable_recap \
--num_inference_steps 28 \
--guidance_scale 3.5 \
--seed 42 \
--pipeline_path "black-forest-labs/FLUX.1-dev" \
--custom_transformer_path "PosterCraft/PosterCraft-v1_RL" \
--qwen_model_path "Qwen/Qwen3-8B"
如果你在內存有限的GPU上運行,可以使用 inference_offload.py
將一些組件卸載到CPU:
python inference_offload.py \
--prompt "Urban Canvas Street Art Expo poster with bold graffiti-style lettering and dynamic colorful splashes" \
--enable_recap \
--num_inference_steps 28 \
--guidance_scale 3.5 \
--seed 42 \
--pipeline_path "black-forest-labs/FLUX.1-dev" \
--custom_transformer_path "PosterCraft/PosterCraft-v1_RL" \
--qwen_model_path "Qwen/Qwen3-8B"
Gradio Web UI
我們為PosterCraft提供了一個Gradio Web UI,請參考我們的 GitHub倉庫。
python demo_gradio.py
✨ 主要特性
PosterCraft是一個用於高質量美學海報生成的統一框架,在精確文本渲染、抽象藝術的無縫融合、醒目佈局和風格協調方面表現出色。
📚 詳細文檔
性能基準
定量結果
方法 |
文本召回率 |
文本F值 |
文本準確率 |
OpenCOLE (Open) |
0.082 |
0.076 |
0.061 |
Playground-v2.5 (Open) |
0.157 |
0.146 |
0.132 |
SD3.5 (Open) |
0.565 |
0.542 |
0.497 |
Flux1.dev (Open) |
0.723 |
0.707 |
0.667 |
Ideogram-v2 (Close) |
0.711 |
0.685 |
0.680 |
BAGEL (Open) |
0.543 |
0.536 |
0.463 |
Gemini2.0-Flash-Gen (Close) |
0.798 |
0.786 |
0.746 |
PosterCraft (我們的方法) |
0.787 |
0.774 |
0.735 |

📄 許可證
本項目使用 flux-1-dev-non-commercial-license 許可證。
📋 引用
如果你發現PosterCraft對您的研究有用,請引用我們的論文:
@article{chen2025postercraft,
title={PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework},
author={Chen, Sixiang and Lai, Jianyu and Gao, Jialin and Ye, Tian and Chen, Haoyu and Shi, Hengyu and Shao, Shitong and Lin, Yunlong and Fei, Song and Xing, Zhaohu and Jin, Yeying and Luo, Junfeng and Wei, Xiaoming and Zhu, Lei},
journal={arXiv preprint arXiv:2506.10741},
year={2025}
}