S

Sana 600M 512px

由 Efficient-Large-Model 开发
Sana是一个高效文本生成图像的框架,能够生成分辨率高达4096×4096的图像,具备快速合成高分辨率、高质量图像的能力
下载量 2,853
发布时间 : 11/30/2024

模型简介

基于线性扩散变换器的文本生成图像模型,使用Gemma2-2B-IT作为文本编码器和DC-AE作为潜在特征编码器

模型特点

高分辨率图像生成
支持生成分辨率高达4096×4096的高质量图像
高效推理
可在笔记本电脑GPU上高效运行,推理速度快
强大的文本-图像对齐
生成的图像与输入文本提示高度匹配
多尺度支持
支持基于512px的多尺度高度和宽度图像生成

模型能力

文本生成图像
高分辨率图像合成
多语言支持

使用案例

艺术创作
艺术作品生成
用于艺术创作和设计过程中的图像生成
生成高质量艺术作品
教育工具
创意教育工具
用于教育或创意工具中的图像生成
辅助教学和创意表达
研究
生成模型研究
用于探索和理解生成模型的局限性和偏见
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase