Xverse
XVerse是一种用于多主体图像合成的创新方法,能在不破坏整体图像潜在特征的情况下,对单个主体进行精确且独立的控制。
下载量 145
发布时间 : 6/26/2025
模型简介
XVerse通过DiT调制实现多主体身份和语义属性的一致控制,能够实现高保真、可编辑的图像生成,有效控制单个主体特征和语义属性,显著提升个性化和复杂场景生成能力。
模型特点
多主体独立控制
能够在不干扰整体图像潜在特征的情况下,对单个主体进行精确且独立的控制。
高保真图像生成
通过将参考图像转换为特定于标记的文本流调制的偏移量,实现高保真、可编辑的图像生成。
语义属性控制
可以稳健地控制单个主体的特征(身份)及其语义属性(如姿势、风格、光照等)。
模型能力
多主体图像合成
身份特征控制
语义属性控制
高保真图像生成
个性化场景生成
使用案例
个性化图像生成
多主体个性化合成
在复杂场景中生成多个具有不同身份和属性的主体图像。
生成的多主体图像保持各自的身份特征和语义属性,同时整体图像协调一致。
创意设计
风格化图像生成
控制单个主体的风格属性(如卡通、写实等)生成风格化图像。
生成的图像中不同主体可以具有不同的风格属性。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98