Xverse
XVerse是一種用於多主體圖像合成的創新方法,能在不破壞整體圖像潛在特徵的情況下,對單個主體進行精確且獨立的控制。
下載量 145
發布時間 : 6/26/2025
模型概述
XVerse通過DiT調製實現多主體身份和語義屬性的一致控制,能夠實現高保真、可編輯的圖像生成,有效控制單個主體特徵和語義屬性,顯著提升個性化和複雜場景生成能力。
模型特點
多主體獨立控制
能夠在不干擾整體圖像潛在特徵的情況下,對單個主體進行精確且獨立的控制。
高保真圖像生成
通過將參考圖像轉換為特定於標記的文本流調製的偏移量,實現高保真、可編輯的圖像生成。
語義屬性控制
可以穩健地控制單個主體的特徵(身份)及其語義屬性(如姿勢、風格、光照等)。
模型能力
多主體圖像合成
身份特徵控制
語義屬性控制
高保真圖像生成
個性化場景生成
使用案例
個性化圖像生成
多主體個性化合成
在複雜場景中生成多個具有不同身份和屬性的主體圖像。
生成的多主體圖像保持各自的身份特徵和語義屬性,同時整體圖像協調一致。
創意設計
風格化圖像生成
控制單個主體的風格屬性(如卡通、寫實等)生成風格化圖像。
生成的圖像中不同主體可以具有不同的風格屬性。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98