X

Xverse

由 ByteDance 开发
XVerse是一种用于多主体图像合成的创新方法,能在不破坏整体图像潜在特征的情况下,对单个主体进行精确且独立的控制。
下载量 145
发布时间 : 6/26/2025

模型简介

XVerse通过DiT调制实现多主体身份和语义属性的一致控制,能够实现高保真、可编辑的图像生成,有效控制单个主体特征和语义属性,显著提升个性化和复杂场景生成能力。

模型特点

多主体独立控制
能够在不干扰整体图像潜在特征的情况下,对单个主体进行精确且独立的控制。
高保真图像生成
通过将参考图像转换为特定于标记的文本流调制的偏移量,实现高保真、可编辑的图像生成。
语义属性控制
可以稳健地控制单个主体的特征(身份)及其语义属性(如姿势、风格、光照等)。

模型能力

多主体图像合成
身份特征控制
语义属性控制
高保真图像生成
个性化场景生成

使用案例

个性化图像生成
多主体个性化合成
在复杂场景中生成多个具有不同身份和属性的主体图像。
生成的多主体图像保持各自的身份特征和语义属性,同时整体图像协调一致。
创意设计
风格化图像生成
控制单个主体的风格属性(如卡通、写实等)生成风格化图像。
生成的图像中不同主体可以具有不同的风格属性。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase