🚀 reddy-v4
このモデルは、black-forest-labs/FLUX.1-dev をベースにした標準的なPEFT LoRAです。主にテキストから画像を生成するタスクに使用されます。
🚀 クイックスタート
このセクションでは、モデルの基本的な使い方を説明します。
✨ 主な機能
- テキストから画像への生成が可能です。
- 画像から画像への変換もサポートしています。
- 安全なコンテンツ生成が保証されています。
📦 インストール
このモデルはHugging FaceのDiffusersライブラリを使用しています。以下のコマンドで必要なライブラリをインストールできます。
pip install diffusers torch
💻 使用例
基本的な使用法
import torch
from diffusers import DiffusionPipeline
model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'Unmapped2895/reddy-v4'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "Realistic wide shot photo of woman posing in a luxurious satin lingerie set, featuring a plunging bra, delicate thong and a classic garter belt with black stockings. The satin lingerie shimmers softly in the light, and the cut emphasizes both sophistication and a hint of allure. The lingerie is detailed with fine lace edges, highlighting her alluring figure. She elegantly styled hair as if getting ready for a formal event. The photo has a cinematic quality with rays of light and dramatic play of shadow and light"
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
model_output = pipeline(
prompt=prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=832,
height=1216,
guidance_scale=3.5,
).images[0]
model_output.save("output.png", format="PNG")
📚 ドキュメント
検証設定
- CFG:
3.5
- CFG Rescale:
0.0
- ステップ数:
20
- サンプラー:
FlowMatchEulerDiscreteScheduler
- シード:
42
- 解像度:
832x1216
- スキップレイヤーガイダンス:
注意: 検証設定は学習設定と必ずしも同じではありません。
学習設定
設定項目 |
詳細 |
学習エポック数 |
10 |
学習ステップ数 |
2000 |
学習率 |
0.0001 |
学習率スケジュール |
一定 |
ウォームアップステップ数 |
500 |
最大勾配値 |
2.0 |
有効バッチサイズ |
1 |
マイクロバッチサイズ |
1 |
勾配累積ステップ数 |
1 |
GPU数 |
1 |
勾配チェックポインティング |
True |
予測タイプ |
flow-matching (追加パラメータ=['shift=3', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flow_matching_loss=compatible', 'flux_lora_target=all']) |
オプティマイザ |
adamw_bf16 |
学習可能パラメータの精度 |
Pure BF16 |
ベースモデルの精度 |
no_change |
キャプションドロップアウト確率 |
10.0% |
LoRAランク |
16 |
LoRAアルファ |
None |
LoRAドロップアウト |
0.1 |
LoRA初期化スタイル |
default |
データセット
reddy-v2-512
- 繰り返し数: 10
- 画像総数: 13
- アスペクトバケット総数: 1
- 解像度: 0.262144メガピクセル
- クロップ: False
- クロップスタイル: None
- クロップアスペクト: None
- 正則化データとしての使用: No
reddy-v2-1024
- 繰り返し数: 10
- 画像総数: 5
- アスペクトバケット総数: 1
- 解像度: 1.048576メガピクセル
- クロップ: False
- クロップスタイル: None
- クロップアスペクト: None
- 正則化データとしての使用: No
📄 ライセンス
このモデルは、Otherライセンスの下で提供されています。