🚀 Kolors-ControlNet-Depthの重みと推論コード
Kolorsベースモデルに基づく2種類のControlNetの重みと推論コード(CannyとDepth)を提供します。
🚀 クイックスタート
このプロジェクトでは、Kolorsベースモデルに基づく2種類のControlNetの重み(CannyとDepth)と推論コードを提供しています。以下にいくつかのサンプル画像を紹介します。
✨ 主な機能
- Kolorsベースモデルに基づくCannyとDepthの2種類のControlNet重みを提供。
- Kolors-IPadapterとKolors-ControlNetの連合推論コードをサポート。
📦 インストール
必要条件
依存関係とインストール方法は、Kolors-BaseModelと基本的に同じです。
重みのダウンロード
huggingface-cli download --resume-download Kwai-Kolors/Kolors-ControlNet-Canny --local-dir weights/Kolors-ControlNet-Canny
huggingface-cli download --resume-download Kwai-Kolors/Kolors-ControlNet-Depth --local-dir weights/Kolors-ControlNet-Depth
深度推定ネットワークを利用する場合は、対応するモデルの重みをダウンロードしてください。
huggingface-cli download lllyasviel/Annotators ./dpt_hybrid-midas-501f0c75.pt --local-dir ./controlnet/annotator/ckpts
💻 使用例
基本的な使用法
a. Canny ControlNetの使用
python ./controlnet/sample_controlNet.py ./controlnet/assets/woman_1.png 一个漂亮的女孩,高品质,超清晰,色彩鲜艳,超高分辨率,最佳品质,8k,高清,4K Canny
python ./controlnet/sample_controlNet.py ./controlnet/assets/dog.png 全景,一只可爱的白色小狗坐在杯子里,看向镜头,动漫风格,3d渲染,辛烷值渲染 Canny
b. Depth ControlNetの使用
python ./controlnet/sample_controlNet.py ./controlnet/assets/woman_2.png 新海诚风格,丰富的色彩,穿着绿色衬衫的女人站在田野里,唯美风景,清新明亮,斑驳的光影,最好的质量,超细节,8K画质 Depth
python ./controlnet/sample_controlNet.py ./controlnet/assets/bird.png 一只颜色鲜艳的小鸟,高品质,超清晰,色彩鲜艳,超高分辨率,最佳品质,8k,高清,4K Depth
c. Depth ControlNet + IP-Adapter-Plusの使用
kolors-ip-adapter-plusを利用する場合は、対応するモデルの重みをダウンロードしてください。
python ./controlnet/sample_controlNet_ipadapter.py ./controlnet/assets/woman_2.png ./ipadapter/asset/2.png 一个红色头发的女孩,唯美风景,清新明亮,斑驳的光影,最好的质量,超细节,8K画质 Depth
📚 ドキュメント
📊 評価
モデルの性能を評価するために、200以上の画像とテキストプロンプトのテストセットを作成しました。いくつかの画像専門家に、異なるモデルの生成結果に対して公正な評価を行ってもらいました。専門家は、生成された画像を視覚的魅力、テキスト忠実度、条件制御性、全体的な満足度の4つの基準で評価します。条件制御性はControlNetが空間構造を保持する能力を測定し、他の基準はベースモデルの評価基準に従います。具体的な結果は以下の表にまとめられており、Kolors-ControlNetは様々な基準で良好な性能を達成しています。
1、Canny
モデル |
平均全体満足度 |
平均視覚的魅力 |
平均テキスト忠実度 |
平均条件制御性 |
SDXL-ControlNet-Canny |
3.14 |
3.63 |
4.37 |
2.84 |
Kolors-ControlNet-Canny |
4.06 |
4.64 |
4.45 |
3.52 |
2、Depth
モデル |
平均全体満足度 |
平均視覚的魅力 |
平均テキスト忠実度 |
平均条件制御性 |
SDXL-ControlNet-Depth |
3.35 |
3.77 |
4.26 |
4.5 |
Kolors-ControlNet-Depth |
4.12 |
4.12 |
4.62 |
4.6 |
SDXL-ControlNet-Canny と SDXL-ControlNet-Depth は、DreamShaper-XL をバックボーンモデルとして読み込みます。
ControlNetデモ
ControlNetとIP-Adapter-Plusのデモ
Kolors-IPadapterとKolors-ControlNetの連合推論コードもサポートしています。

📄 ライセンス
このプロジェクトは、Apache-2.0ライセンスの下で公開されています。
謝辞