L

Lumina Next SFT Diffusers

由Alpha-VLLM開發
Lumina-Next-SFT是一款包含20億參數的Next-DiT模型,採用Gemma-2B作為文本編碼器,並通過高質量監督微調(SFT)進行增強的文生圖模型。
下載量 8,442
發布時間 : 6/20/2024

模型概述

Lumina-Next-SFT是基於Next-DiT架構的文生圖擴散模型,使用Gemma-2B作為文本編碼器,能夠根據文本描述生成高質量圖像。

模型特點

高質量監督微調
通過高質量監督微調(SFT)增強模型性能,提升生成圖像的質量
高效架構
採用Next-DiT骨幹網絡,實現更快速度更低內存佔用的圖像生成
強大文本理解
使用Gemma-2B作為文本編碼器,提供優秀的文本理解能力
高分辨率支持
支持最高2K分辨率的圖像生成

模型能力

文本到圖像生成
高分辨率圖像生成
複雜場景理解

使用案例

創意設計
概念藝術創作
根據文字描述生成遊戲或電影的概念藝術圖
生成具有特定風格和細節的概念藝術作品
內容創作
社交媒體內容生成
為社交媒體帖子生成配圖
快速生成與文本內容匹配的視覺圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase