🚀 CATVTON-Flux模型卡片
CATVTON-Flux是一种先进的虚拟试穿解决方案,它将CATVTON(对比外观和拓扑虚拟试穿)与Flux填充修复模型相结合,实现逼真且准确的服装转移。
🚀 快速开始
要开始使用该模型,可通过以下代码:
transformer = FluxTransformer2DModel.from_pretrained(
"xiaozaa/catvton-flux-beta",
torch_dtype=torch.bfloat16
)
pipe = FluxFillPipeline.from_pretrained(
"black-forest-labs/FLUX.1-dev",
transformer=transformer,
torch_dtype=torch.bfloat16
).to("cuda")
✨ 主要特性
该模型专为虚拟试穿应用而设计,允许用户直观地看到不同服装穿在人身上的效果。
📦 安装指南
暂未提及具体安装步骤,可参考代码示例部分进行模型加载。
💻 使用示例
基础用法
transformer = FluxTransformer2DModel.from_pretrained(
"xiaozaa/catvton-flux-beta",
torch_dtype=torch.bfloat16
)
pipe = FluxFillPipeline.from_pretrained(
"black-forest-labs/FLUX.1-dev",
transformer=transformer,
torch_dtype=torch.bfloat16
).to("cuda")
📚 详细文档
模型详情
模型描述
模型来源
使用场景
该模型可用于虚拟试穿应用,可通过命令行界面直接使用,所需参数如下:
- 输入人物图像
- 人物遮罩
- 服装图像
- 随机种子(可选)
训练详情
训练数据
dresscode数据集
训练过程
对Flux1-dev-fill进行微调
评估
结果
[需要更多信息]
总结
BibTeX引用:
@misc{chong2024catvtonconcatenationneedvirtual,
title={CatVTON: Concatenation Is All You Need for Virtual Try-On with Diffusion Models},
author={Zheng Chong and Xiao Dong and Haoxiang Li and Shiyue Zhang and Wenqing Zhang and Xujie Zhang and Hanqing Zhao and Xiaodan Liang},
year={2024},
eprint={2407.15886},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2407.15886},
}
@article{lhhuang2024iclora,
title={In-Context LoRA for Diffusion Transformers},
author={Huang, Lianghua and Wang, Wei and Wu, Zhi-Fan and Shi, Yupeng and Dou, Huanzhang and Liang, Chen and Feng, Yutong and Liu, Yu and Zhou, Jingren},
journal={arXiv preprint arxiv:2410.23775},
year={2024}
}
📄 许可证
cc-by-nc-2.0
📋 信息表格
属性 |
详情 |
库名称 |
diffusers |
模型类型 |
图像到图像(image-to-image) |
基础模型 |
black-forest-labs/FLUX.1-Fill-dev |
许可证 |
cc-by-nc-2.0 |
标签 |
tryon、vto |