🚀 ヒストリックカラースーン® (by A.C.T. スーン®)
このモデルは、次の点に特化した、多用途の画像とテキスト生成モデルです。
- 低ステップ数(ほとんどのシナリオで2〜8)で高品質な生成が可能で、768x768の4ステップ推論で、Flux v.1 Devに匹敵する、あるいはそれを上回る写実的な出力を得ることができます。
- アウトクロームからコダクローム、フジフィルムなど、幅広い代表的なカラーフィルムアナログ写真に似たリアルな画像を生成します。
- 同程度のステップ数やリソース消費で、他のモデルよりも、やや「歴史的」または「実生活感」のある美学的なキャラクター、鮮やかな色度と光度のダイナミクス、および質感/解剖学的/肌の詳細を持つビジュアルを生成します。

📚 ドキュメント
基礎/方法/ツール
- 主要ベースモデル: FLUX.1-schnell(Black Forest Labsによる)
- 二次ベースモデル: Pixelwave Schnell V.1(HumbleMikeyによる)。SafetensorsとGGUFの重みは、こちらのHF、および/またはモデルのCivitAIページこちらで見つけることができます。
- 微調整(Pixelwave Schnell V.1に対して): 主に、1900年代から1910年代にかけてSergey Prokudin - Gorskyが撮影した約500枚のカラー写真を使用します。彼は当時、広範囲に旅をして撮影を行い、初期の三色合成写真技術の実装を開拓し、完成度を高めました。
私たちは、あなたにProkudin - Gorskyの作品をぜひ自ら探索していただきたいと思います。[このリンク](https://prokudin - gorsky.org/)の素晴らしく整理されたオンラインアーカイブには、撮影者の元のガラス版ネガからの数百枚の高品質なダウンロード可能な合成カラー写真プリントのスキャンがあり、このサイトでは画像の大部分が比較的最近復元されています。
元のガラス版ネガと、大量のプリント(およびその他の関連するアーティファクト、文書、展示品)は、現在、米国ワシントンDCの議会図書館に保管され、管理されています。
- FLUX.1 - schnellの完全ランクLoRA微調整: 同じデータセットからの130枚の写真を使用して、このモデルの最初のLoRA構成であるHistoric Color Schnell LoRAを作成します。
- 同様のデータセットを使用し、Schnell(および/またはDev)の特定のブロックのみを対象とした、さらに5つのLoRAのトレーニング実験。
- [Kohya - ssのsd - scripts git](https://github.com/kohya - ss/sd - scripts/tree/sd3)のsd3ブランチ/networksの'flux_merge_lora.py'スクリプトを使用して、後者の結果の中で最も成功したものをHistoric Color Schnell LoRAとマージします。必要に応じて、同じソースの'convert_flux_lora.py'スクリプトを使用して、LoRAを(ai - toolkit/Diffusers関連とKohya/sd - scripts形式の間で)変換します。
- 結果として得られたLoRAを、以前にPixelwave Schnell v.1から微調整されたチェックポイントにマージします。
- Schnell用のOstrisのトレーニングアダプター: [ostris/FLUX.1 - schnell - training - adapter](https://huggingface.co/ostris/FLUX.1 - schnell - training - adapter)
トリガーワード
HST
を使用すると、ヴィンテージ/アウトクローム効果を高めることができます。ただし、Historic Color LoRA(s)とは対照的に、このトリガーはチェックポイントに対する影響がそれほど大きくないようです。
歴史的な注記
Prokudin - Gorskyのカラー写真技術では、特殊な色スペクトルフィルター(基本的にはR.B.G:赤、青、緑)を使用して、同時または逐次的に3回の写真露光を行い、光乳化混合物で覆われたガラス板に被写体/ショットを焼き付けます。
撮影者は、現像液とフィルターの品質の改善に注力し、絶え間ない広範な実験と、ガラス板の巧みな最適化(一般に扱いにくく、特にカラーには不向きで、1910年代にはすでに白黒の現地撮影では時代遅れになっていましたが、それ以外の点では非常に信頼性が高い)を行い、最終的には同時代のほとんどの人よりもはるかに忠実で鮮やかなカラー写真作品を生み出しました。
同時に、撮影者の方法の特異性と、その非常に手作業による実行が相まって、結果として得られたプリント全体に共通する、独特な色、光、および動きのアーティファクトが現れます。
画像全体を損なうことはめったになく、同時代に登場したいくつかのアウトクローム技術の弱点よりも軽微です。Prokudin - Gorskyの多くのプリントを囲む暖かい色の霞やフレアは、一種の儚い署名と見なすことができます。
彼の作品のより微妙な色、質感、および(ある程度)人物像の特徴とともに、これらのオーラは、Flux用の一連の歴史的アダプターの4番目であるこのFlux Schnell LoRAに確実に刻印されています。

モデルのダウンロード
'ヒストリックカラースーン®'の重みは、別のリポジトリでSafetensors形式で入手できます。
こちらの「Files & versions」タブからダウンロードしてください。
このモデルは、🧨 Diffusers形式でこのリポジトリ内にもあります。

💻 使用例
基本的な使用法
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("Shakker-Labs/AWPortrait-FL", torch_dtype=torch.bfloat16)
pipe.to("cuda")
pipe.enable_model_cpu_offload()
prompt = "HST style autochrome film photograph portrait of 1910 woman playing poker against a purple feathered dinosaur, the green-eyed woman has moderately blemished skin with visible lines and pores, she smiles, film grain, Kodachrome"
image = pipe(
prompt,
guidance_scale=1.2,
num_inference_steps=4,
max_sequence_length=256,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("hstcolor1.png")
詳細については、diffusersのドキュメントを参照してください。
また、あなたが一般的な文学、特に古いモダニスト詩に興味がある場合は、私の詩の翻訳をSILVER AGE POETSでチェックしてみてください!

📄 ライセンス
このプロジェクトは、Apache - 2.0ライセンスの下で公開されています。