Illustrious-xl-early-release-v0開源插畫生成模型

首頁

Illustrious Xl Early Release V0

由OnomaAIResearch開發

基於Kohaku XL Beta 5開發的專注於插畫生成的Stable Diffusion XL模型，由OnomaAI研究團隊訓練

圖像生成英語開源協議:其他 #插畫生成 #Danbooru風格 #藝術創作

下載量 93.95k

發布時間 : 9/20/2024

模型概述

Illustrious XL是基於Danbooru2023數據集及其變體微調的強大生成模型系列，適用於創意藝術AI生成任務

模型特點

插畫生成優化

專注於插畫生成，利用大規模標註數據集Danbooru2023進行微調

多版本支持

提供基礎版和GUIDED版（含安全控制）兩種模型變體

開源友好

採用公平AI公共許可證，鼓勵衍生作品保持開源

模型能力

動漫風格圖像生成

多樣化角色設計

藝術風格轉換

高分辨率圖像生成

使用案例

數字藝術創作

動漫角色設計

生成具有不同風格和特徵的動漫角色

示例圖中展示的多樣化角色形象

概念藝術創作

為遊戲或影視項目快速生成概念藝術

創意內容生產

社交媒體內容

為社交媒體平臺生成吸引人的插畫內容

🚀 Illustrious XL v0.1

Illustrious XL v0.1 是一款專注於插畫生成的 Stable Diffusion XL 模型，它基於 Kohaku XL Beta 5 繼續訓練而來。該模型利用大規模標註數據集 Danbooru2023 進行訓練，能夠生成多樣化的角色設計和藝術風格的圖像，適用於創意和藝術領域的 AI 生成任務。

🚀 快速開始

Illustrious XL 是一款專注於插畫的 Stable Diffusion XL 模型，它基於 Kohaku XL Beta 5 繼續訓練，由 OnomaAI 研究團隊開發。該模型專注於利用大規模標註數據集 Danbooru2023。我們在此發佈了 v0.1 和 v0.1 - GUIDED 模型，採用公平的公共人工智能許可證，但不鼓勵將模型用於商業化目的或任何閉源用途。如需完整的技術細節，請參考我們的技術報告。

✨ 主要特性

模型信息

屬性	詳情
名稱	Illustrious - XL - v0.1
模型類型	Stable Diffusion XL 模型
數據集	在 Danbooru2023 數據集上進行微調

模型描述

Illustrious - XL：是一個強大的生成模型系列，在全面的 Danbooru2023 數據集及其變體上進行了微調。它包含了來自數據集的各種角色設計、風格和藝術知識，適用於創意和藝術領域的 AI 生成任務。
Illustrious - XL - v0.1：是未經調整的基礎模型，可作為未來所有模型變體的基礎。可以在此模型上訓練 LoRAs / 適配器，以滿足未來的使用場景。該模型僅用於研究目的，未針對美學或偏好進行調整。
Illustrious - XL - v0.1 - GUIDED：是經過最低限度安全控制的模型，更適合日常使用。

技術細節

相關技術報告請參考：https://arxiv.org/abs/2409.19946

使用條款

建議使用官方倉庫，以防止惡意攻擊。
用戶必須同意許可證才能使用該模型。如許可證中所述，我們不對生成的結果或可能的變體承擔任何責任。
如許可證中所述，用戶不得將生成的結果用於任何禁止的目的，包括但不限於：
- 有害或惡意活動：包括騷擾、威脅、傳播虛假信息或任何旨在傷害個人或群體的用途。
- 非法活動：使用生成的內容違反任何適用的法律法規。
- 不道德、冒犯性內容生成：生成違反道德準則的冒犯性、誹謗性或有爭議的內容。

安全控制建議

生成模型偶爾可能會產生意外或有害的輸出。
為了降低這種風險，強烈建議使用 GUIDED 模型變體，該變體包含額外的安全機制，以確保負責任的內容生成。
通過選擇此變體，用戶可以顯著降低生成有害或意外內容的可能性。
我們計劃通過廣泛的研究更新 GUIDED 模型變體及其方法。

訓練/合併策略

您可以基於此模型進行微調、合併或訓練 LoRA。但是，為了促進開源社區的發展，您需要：

公開分享任何派生模型的詳細信息，包括對根據公平人工智能公共許可證許可的原始模型的引用。
提供用於微調或訓練的數據集和“合併配方”的信息。
遵守 公平人工智能公共許可證，確保任何派生作品也是開源的。

上傳/生成策略

我們不限制生成結果的任何上傳或傳播，因為我們不擁有生成材料的任何權利。這包括“個人訓練的模型 / 微調模型 / 訓練的 LoRA 相關結果”。但是，我們懇請您公開生成細節，以促進開源社區和研究的發展。

商業化禁止

禁止對任何 閉源微調/合併模型進行商業化，這些模型不允許公眾訪問模型的源代碼/權重及其使用方法。
根據許可證，您必須公開發布任何派生模型和變體。此模型旨在用於開源用途，所有派生模型必須遵循相同的原則。

使用建議

不建議過度使用關鍵構圖標籤，如“特寫”、“顛倒”或“牛仔視角”，因為它們可能會相互衝突並導致混淆，影響模型結果。
推薦的採樣方法：Euler a，採樣步數：20 - 28，CFG：5 - 7.5（可能根據使用情況有所不同）。
建議根據您的使用情況使用合適的構圖標籤，如“上半身”、“牛仔視角”、“肖像”或“全身”。
模型支持質量標籤，如：“最差質量”、“低質量”、“平均質量”、“高質量”、“最佳質量”和“傑作（質量）”。
注意：模型沒有任何默認風格，這是基礎模型的預期行為。

🔧 技術細節

開發歷程

當我們開始開發 Illustrious XL 系列時，目標很簡單：當時沒有適用於插畫的強大預訓練模型，所以我們決定自己構建一個——一個預訓練級別的微調模型，供藝術家和研究人員使用。我們也知道將所有內容保留在內部不會推動該領域的發展，因此我們向公眾發佈了 v0.1，並專注於訓練更新的變體，通過提高質量、深化知識和改進架構來進一步提升模型的能力。在此過程中，我們意外發現該模型不僅擅長插畫，還能理解自然語言、處理複雜提示並生成高分辨率圖像，遠遠超出了我們最初的計劃。

模型版本

v0.1（2024 年 5 月訓練）
v1.0（2024 年 7 月）
v1.1（2024 年 8 月）
v2.0（2024 年 9 月）
v3（2024 年 11 月）
v3.5（結合了 Google 的 v - 參數化的特殊變體）

這些模型在自然語言構圖和圖像生成方面更進一步。

未來計劃

經過幾個月的幕後工作，我們終於準備好向前邁進。我們將逐步推出最新模型，同時逐步將以前的版本開源，以便進行研究和改進。在此過程中，預計會有諸如 真正的 2K 分辨率生成 和更好的自然語言對齊等突破。

開源承諾

這需要時間，但我們正在快速推進。我們的下一代模型已經在開發中，旨在解決 SD XL 基礎架構的一些基本限制。隨著進展，舊模型自然會被棄用，並相應地發佈權重。我們的團隊旨在謹慎行事，確保每個版本都有全面的解釋和見解。

向後兼容性

我們構建的每個模型都考慮了向後兼容性，因為 Illustrious XL 不僅僅是創造新事物，更是為微調創建一個更好的基礎。這就是為什麼我們在正確訓練 LoRAs 方面投入了大量精力，不久後，我們將分享如何更有效地訓練它們的見解。

📄 許可證

本模型採用公平人工智能公共許可證 1.0 - SD（fair - ai - public - license - 1.0 - sd），許可證鏈接：[https://freedevproject.org/faipl - 1.0 - sd/](https://freedevproject.org/faipl - 1.0 - sd/)。