Ben-Brand-LoRAオープンソースモデル - 無料でデプロイしてテキストから画像生成と特定のアートスタイル変換を実現

Home

Ben Brand LoRA

Developed by davidrd123

FLUX.1-devでトレーニングされたPEFT LoRAモデルで、テキストから画像生成タスクに特化し、特定の芸術スタイル変換をサポートします。

画像生成 Open Source License:Other #FLUX.1スタイル適応 #高解像度画像生成 #芸術的テキストから画像へ

Downloads 253

Release Time : 2/19/2025

Model Overview

これはFLUX.1-devベースモデルでトレーニングされた標準PEFT LoRAモデルで、主にテキストから画像生成タスクに使用され、テキスト記述に基づいて特定の芸術スタイルを持つ画像を生成できます。

Model Features

芸術スタイル変換

テキスト記述に基づいて特定の芸術スタイルを持つ画像を生成できます。例のb3nbr4nd画風など。

高解像度出力

最大1024x1024解像度の画像生成をサポートします。

効率的な微調整

LoRA技術を使用したパラメータ効率的な微調整で、少数のパラメータをトレーニングするだけでスタイル転送を実現します。

Model Capabilities

テキストから画像生成

芸術スタイル変換

高解像度画像生成

Use Cases

クリエイティブデザイン

コンセプトアート作成

テキスト記述に基づいて迅速にコンセプトアート画像を生成

例のオベリスクに巻き付いた巨大な緑の蛇の画像など

スタイライズド画像生成

一般的な記述を特定の芸術スタイルの画像に変換

b3nbr4nd画風の画像生成など

ゲーム開発

ゲームシーンコンセプトデザイン

ゲームシーンのコンセプト図を迅速に生成

例の部分的に埋もれた古代遺跡のシーンなど

🚀 Ben-Brand-LoRA

このプロジェクトは、black-forest-labs/FLUX.1-dev をベースにした標準的なPEFT LoRAです。

学習中に検証用のプロンプトは使用されていません。

🚀 クイックスタート

このLoRAモデルは、特定の画像生成タスクに使用できます。以下のセクションで、モデルの検証設定、学習設定、推論方法について説明します。

✨ 主な機能

特定のスタイルの画像生成が可能です。
ベースモデルのテキストエンコーダを再利用して推論ができます。

📚 詳細ドキュメント

検証設定

設定項目	詳細
CFG	`3.0`
CFG Rescale	`0.0`
Steps	`20`
Sampler	`FlowMatchEulerDiscreteScheduler`
Seed	`42`
Resolution	`1024x1024`
Skip-layer guidance

注意: 検証設定は学習設定と必ずしも同じではありません。

学習設定

学習エポック数: 2
学習ステップ数: 3750
学習率: 0.00015
- 学習率スケジュール: 一定
- ウォームアップステップ数: 100
最大勾配ノルム: 0.1
有効バッチサイズ: 6
- マイクロバッチサイズ: 2
- 勾配累積ステップ数: 3
- GPU数: 1
勾配チェックポイント: True
予測タイプ: flow-matching (追加パラメータ=['shift=3', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flow_matching_loss=compatible', 'flux_lora_target=all'])
オプティマイザ: adamw_bf16
学習可能パラメータの精度: Pure BF16
キャプションドロップアウト確率: 10.0%
LoRAランク: 64
LoRAアルファ: None
LoRAドロップアウト: 0.1
LoRA初期化スタイル: デフォルト

データセット

ben-brand-256

繰り返し数: 10
画像総数: 98
アスペクトバケット総数: 3
解像度: 0.065536メガピクセル
クロップ: False
クロップスタイル: None
クロップアスペクト: None
正則化データとして使用: No

ben-brand-crop-256

繰り返し数: 10
画像総数: 98
アスペクトバケット総数: 1
解像度: 0.065536メガピクセル
クロップ: True
クロップスタイル: 中央
クロップアスペクト: 正方形
正則化データとして使用: No

ben-brand-512

繰り返し数: 10
画像総数: 98
アスペクトバケット総数: 3
解像度: 0.262144メガピクセル
クロップ: False
クロップスタイル: None
クロップアスペクト: None
正則化データとして使用: No

ben-brand-crop-512

繰り返し数: 10
画像総数: 98
アスペクトバケット総数: 1
解像度: 0.262144メガピクセル
クロップ: True
クロップスタイル: 中央
クロップアスペクト: 正方形
正則化データとして使用: No

ben-brand-768

繰り返し数: 10
画像総数: 98
アスペクトバケット総数: 3
解像度: 0.589824メガピクセル
クロップ: False
クロップスタイル: None
クロップアスペクト: None
正則化データとして使用: No

ben-brand-crop-768

繰り返し数: 10
画像総数: 98
アスペクトバケット総数: 1
解像度: 0.589824メガピクセル
クロップ: True
クロップスタイル: 中央
クロップアスペクト: 正方形
正則化データとして使用: No

ben-brand-1024

繰り返し数: 10
画像総数: 98
アスペクトバケット総数: 4
解像度: 1.048576メガピクセル
クロップ: False
クロップスタイル: None
クロップアスペクト: None
正則化データとして使用: No

ben-brand-crop-1024

繰り返し数: 10
画像総数: 98
アスペクトバケット総数: 1
解像度: 1.048576メガピクセル
クロップ: True
クロップスタイル: 中央
クロップアスペクト: 正方形
正則化データとして使用: No

ben-brand-1440

繰り返し数: 10
画像総数: 98
アスペクトバケット総数: 2
解像度: 2.0736メガピクセル
クロップ: False
クロップスタイル: None
クロップアスペクト: None
正則化データとして使用: No

ben-brand-crop-1440

繰り返し数: 10
画像総数: 98
アスペクトバケット総数: 1
解像度: 2.0736メガピクセル
クロップ: True
クロップスタイル: 中央
クロップアスペクト: 正方形
正則化データとして使用: No

💻 使用例

基本的な使用法

import torch
from diffusers import DiffusionPipeline

model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'davidrd123/Ben-Brand-LoRA'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16) # loading directly in bf16
pipeline.load_lora_weights(adapter_id)

prompt = "An astronaut is riding a horse through the jungles of Thailand."


## Optional: quantise the model to save on vram.
## Note: The model was quantised during training, and so it is recommended to do the same during inference time.
from optimum.quanto import quantize, freeze, qint8
quantize(pipeline.transformer, weights=qint8)
freeze(pipeline.transformer)
    
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu') # the pipeline is already in its target precision level
image = pipeline(
    prompt=prompt,
    num_inference_steps=20,
    generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
    width=1024,
    height=1024,
    guidance_scale=3.0,
).images[0]
image.save("output.png", format="PNG")