Lumina Next SFT Diffusers
Lumina-Next-SFTは20億パラメータのNext-DiTモデルで、Gemma-2Bをテキストエンコーダーとして採用し、高品質な教師あり微調整(SFT)で強化されたテキストから画像生成モデルです。
Downloads 8,442
Release Time : 6/20/2024
Model Overview
Lumina-Next-SFTはNext-DiTアーキテクチャに基づくテキストから画像生成拡散モデルで、Gemma-2Bをテキストエンコーダーとして使用し、テキスト記述から高品質な画像を生成できます。
Model Features
高品質な教師あり微調整
高品質な教師あり微調整(SFT)によりモデル性能を強化し、生成画像の品質を向上
効率的なアーキテクチャ
Next-DiTバックボーンネットワークを採用し、より高速でメモリ使用量の少ない画像生成を実現
強力なテキスト理解
Gemma-2Bをテキストエンコーダーとして使用し、優れたテキスト理解能力を提供
高解像度サポート
最大2K解像度の画像生成をサポート
Model Capabilities
テキストから画像生成
高解像度画像生成
複雑なシーン理解
Use Cases
クリエイティブデザイン
コンセプトアート創作
テキスト記述に基づいてゲームや映画のコンセプトアートを生成
特定のスタイルとディテールを持つコンセプトアート作品を生成
コンテンツ制作
ソーシャルメディアコンテンツ生成
ソーシャルメディア投稿用の画像を生成
テキスト内容にマッチした視覚画像を迅速に生成
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98