🚀 reddy-v2
このモデルは、black-forest-labs/FLUX.1-dev をベースとした標準的なPEFT LoRAです。主にテキストから画像を生成するタスクに使用されます。
🚀 クイックスタート
このモデルを使用するには、以下の手順に従ってください。
推論の実行
import torch
from diffusers import DiffusionPipeline
model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'Unmapped2895/reddy-v2'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "Realistic wide shot photo of woman posing in a luxurious satin lingerie set, featuring a plunging bra, delicate thong and a classic garter belt with black stockings. The satin lingerie shimmers softly in the light, and the cut emphasizes both sophistication and a hint of allure. The lingerie is detailed with fine lace edges, highlighting her alluring figure. She elegantly styled hair as if getting ready for a formal event. The photo has a cinematic quality with rays of light and dramatic play of shadow and light"
from optimum.quanto import quantize, freeze, qint8
quantize(pipeline.transformer, weights=qint8)
freeze(pipeline.transformer)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
model_output = pipeline(
prompt=prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=832,
height=1216,
guidance_scale=2.0,
).images[0]
model_output.save("output.png", format="PNG")
✨ 主な機能
- テキストから画像を生成することができます。
- 特定の設定での検証が行われており、安定した性能を発揮します。
📦 インストール
このモデルを使用するには、diffusers
ライブラリが必要です。以下のコマンドでインストールできます。
pip install diffusers
💻 使用例
基本的な使用法
上記の推論コードを参照してください。
📚 ドキュメント
検証設定
- CFG:
2.0
- CFG Rescale:
0.0
- Steps:
20
- Sampler:
FlowMatchEulerDiscreteScheduler
- Seed:
42
- Resolution:
832x1216
- Skip-layer guidance:
注意: 検証設定は 学習設定 と必ずしも同じではありません。
以下のギャラリーでいくつかのサンプル画像を見ることができます。
テキストエンコーダは学習されていません。推論にはベースモデルのテキストエンコーダを再利用できます。
学習設定
-
学習エポック数: 3
-
学習ステップ数: 600
-
学習率: 0.0001
- 学習率スケジュール: 一定
- ウォームアップステップ数: 500
-
最大勾配値: 2.0
-
有効バッチサイズ: 1
- マイクロバッチサイズ: 1
- 勾配累積ステップ数: 1
- GPU数: 1
-
勾配チェックポイント: True
-
予測タイプ: flow-matching (追加パラメータ=['shift=3', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flow_matching_loss=compatible', 'flux_lora_target=all'])
-
オプティマイザ: adamw_bf16
-
学習可能パラメータの精度: Pure BF16
-
ベースモデルの精度: int8-quanto
-
キャプションドロップアウト確率: 0.0%
-
LoRAランク: 32
-
LoRAアルファ: None
-
LoRAドロップアウト: 0.1
-
LoRA初期化スタイル: default
データセット
reddy-v2-512
- 繰り返し数: 10
- 画像の総数: 13
- アスペクトバケットの総数: 1
- 解像度: 0.262144メガピクセル
- クロップ: False
- クロップスタイル: None
- クロップアスペクト: None
- 正則化データとして使用: No
reddy-v2-1024
- 繰り返し数: 10
- 画像の総数: 5
- アスペクトバケットの総数: 1
- 解像度: 1.048576メガピクセル
- クロップ: False
- クロップスタイル: None
- クロップアスペクト: None
- 正則化データとして使用: No
📄 ライセンス
このモデルは、otherライセンスの下で提供されています。