🚀 Ben-Brand-LoRA
このプロジェクトは、black-forest-labs/FLUX.1-dev をベースにした標準的なPEFT LoRAです。
学習中に検証用のプロンプトは使用されていません。
🚀 クイックスタート
このLoRAモデルは、特定の画像生成タスクに使用できます。以下のセクションで、モデルの検証設定、学習設定、推論方法について説明します。
✨ 主な機能
- 特定のスタイルの画像生成が可能です。
- ベースモデルのテキストエンコーダを再利用して推論ができます。
📚 詳細ドキュメント
検証設定
設定項目 |
詳細 |
CFG |
3.0 |
CFG Rescale |
0.0 |
Steps |
20 |
Sampler |
FlowMatchEulerDiscreteScheduler |
Seed |
42 |
Resolution |
1024x1024 |
Skip-layer guidance |
|
注意: 検証設定は 学習設定 と必ずしも同じではありません。
学習設定
- 学習エポック数: 2
- 学習ステップ数: 3750
- 学習率: 0.00015
- 学習率スケジュール: 一定
- ウォームアップステップ数: 100
- 最大勾配ノルム: 0.1
- 有効バッチサイズ: 6
- マイクロバッチサイズ: 2
- 勾配累積ステップ数: 3
- GPU数: 1
- 勾配チェックポイント: True
- 予測タイプ: flow-matching (追加パラメータ=['shift=3', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flow_matching_loss=compatible', 'flux_lora_target=all'])
- オプティマイザ: adamw_bf16
- 学習可能パラメータの精度: Pure BF16
- キャプションドロップアウト確率: 10.0%
- LoRAランク: 64
- LoRAアルファ: None
- LoRAドロップアウト: 0.1
- LoRA初期化スタイル: デフォルト
データセット
ben-brand-256
- 繰り返し数: 10
- 画像総数: 98
- アスペクトバケット総数: 3
- 解像度: 0.065536メガピクセル
- クロップ: False
- クロップスタイル: None
- クロップアスペクト: None
- 正則化データとして使用: No
ben-brand-crop-256
- 繰り返し数: 10
- 画像総数: 98
- アスペクトバケット総数: 1
- 解像度: 0.065536メガピクセル
- クロップ: True
- クロップスタイル: 中央
- クロップアスペクト: 正方形
- 正則化データとして使用: No
ben-brand-512
- 繰り返し数: 10
- 画像総数: 98
- アスペクトバケット総数: 3
- 解像度: 0.262144メガピクセル
- クロップ: False
- クロップスタイル: None
- クロップアスペクト: None
- 正則化データとして使用: No
ben-brand-crop-512
- 繰り返し数: 10
- 画像総数: 98
- アスペクトバケット総数: 1
- 解像度: 0.262144メガピクセル
- クロップ: True
- クロップスタイル: 中央
- クロップアスペクト: 正方形
- 正則化データとして使用: No
ben-brand-768
- 繰り返し数: 10
- 画像総数: 98
- アスペクトバケット総数: 3
- 解像度: 0.589824メガピクセル
- クロップ: False
- クロップスタイル: None
- クロップアスペクト: None
- 正則化データとして使用: No
ben-brand-crop-768
- 繰り返し数: 10
- 画像総数: 98
- アスペクトバケット総数: 1
- 解像度: 0.589824メガピクセル
- クロップ: True
- クロップスタイル: 中央
- クロップアスペクト: 正方形
- 正則化データとして使用: No
ben-brand-1024
- 繰り返し数: 10
- 画像総数: 98
- アスペクトバケット総数: 4
- 解像度: 1.048576メガピクセル
- クロップ: False
- クロップスタイル: None
- クロップアスペクト: None
- 正則化データとして使用: No
ben-brand-crop-1024
- 繰り返し数: 10
- 画像総数: 98
- アスペクトバケット総数: 1
- 解像度: 1.048576メガピクセル
- クロップ: True
- クロップスタイル: 中央
- クロップアスペクト: 正方形
- 正則化データとして使用: No
ben-brand-1440
- 繰り返し数: 10
- 画像総数: 98
- アスペクトバケット総数: 2
- 解像度: 2.0736メガピクセル
- クロップ: False
- クロップスタイル: None
- クロップアスペクト: None
- 正則化データとして使用: No
ben-brand-crop-1440
- 繰り返し数: 10
- 画像総数: 98
- アスペクトバケット総数: 1
- 解像度: 2.0736メガピクセル
- クロップ: True
- クロップスタイル: 中央
- クロップアスペクト: 正方形
- 正則化データとして使用: No
💻 使用例
基本的な使用法
import torch
from diffusers import DiffusionPipeline
model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'davidrd123/Ben-Brand-LoRA'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "An astronaut is riding a horse through the jungles of Thailand."
from optimum.quanto import quantize, freeze, qint8
quantize(pipeline.transformer, weights=qint8)
freeze(pipeline.transformer)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
prompt=prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=1024,
height=1024,
guidance_scale=3.0,
).images[0]
image.save("output.png", format="PNG")
注意事項
⚠️ 重要提示
検証設定は必ずしも学習設定と同じではありません。
モデルは学習中に量子化されているため、推論時にも同じ操作を行うことをおすすめします。
📄 ライセンス
Other