Sana 1600M 1024px MultiLing
模型概述
Sana是一個基於線性擴散Transformer的文本生成圖像模型,能夠快速合成高分辨率、高質量且文本-圖像對齊良好的圖像,支持英文、中文及表情符號混合提示詞。
模型特點
高分辨率圖像生成
支持生成分辨率高達4096×4096的高質量圖像
多語言支持
支持英文、中文及表情符號混合提示詞
高效推理
可在筆記本電腦GPU上部署,實現快速圖像生成
文本-圖像對齊良好
生成的圖像與輸入文本提示高度匹配
模型能力
文本生成圖像
高分辨率圖像合成
多語言提示支持
快速推理
使用案例
創意藝術
藝術作品生成
用於生成藝術作品和創意設計
高質量的藝術圖像
設計輔助
在設計流程中快速生成視覺概念
加速設計過程
教育
教育工具開發
開發教育或創意工具
增強學習體驗
研究
生成模型研究
用於探索和理解生成模型的侷限性與偏差
推動模型技術進步
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98