🚀 Illustrious XL v0.1
Illustrious XL v0.1 是一款專注於插畫生成的 Stable Diffusion XL 模型,它基於 Kohaku XL Beta 5 繼續訓練而來。該模型利用大規模標註數據集 Danbooru2023 進行訓練,能夠生成多樣化的角色設計和藝術風格的圖像,適用於創意和藝術領域的 AI 生成任務。
🚀 快速開始
Illustrious XL 是一款專注於插畫的 Stable Diffusion XL 模型,它基於 Kohaku XL Beta 5 繼續訓練,由 OnomaAI 研究團隊開發。該模型專注於利用大規模標註數據集 Danbooru2023。我們在此發佈了 v0.1 和 v0.1 - GUIDED 模型,採用公平的公共人工智能許可證,但不鼓勵將模型用於商業化目的或任何閉源用途。如需完整的技術細節,請參考我們的技術報告。
✨ 主要特性
模型信息
屬性 |
詳情 |
名稱 |
Illustrious - XL - v0.1 |
模型類型 |
Stable Diffusion XL 模型 |
數據集 |
在 Danbooru2023 數據集上進行微調 |
模型描述
- Illustrious - XL:是一個強大的生成模型系列,在全面的 Danbooru2023 數據集及其變體上進行了微調。它包含了來自數據集的各種角色設計、風格和藝術知識,適用於創意和藝術領域的 AI 生成任務。
- Illustrious - XL - v0.1:是未經調整的基礎模型,可作為未來所有模型變體的基礎。可以在此模型上訓練 LoRAs / 適配器,以滿足未來的使用場景。該模型僅用於研究目的,未針對美學或偏好進行調整。
- Illustrious - XL - v0.1 - GUIDED:是經過最低限度安全控制的模型,更適合日常使用。
技術細節
相關技術報告請參考:https://arxiv.org/abs/2409.19946
使用條款
- 建議使用官方倉庫,以防止惡意攻擊。
- 用戶必須同意許可證才能使用該模型。如許可證中所述,我們不對生成的結果或可能的變體承擔任何責任。
- 如許可證中所述,用戶不得將生成的結果用於任何禁止的目的,包括但不限於:
- 有害或惡意活動:包括騷擾、威脅、傳播虛假信息或任何旨在傷害個人或群體的用途。
- 非法活動:使用生成的內容違反任何適用的法律法規。
- 不道德、冒犯性內容生成:生成違反道德準則的冒犯性、誹謗性或有爭議的內容。
安全控制建議
- 生成模型偶爾可能會產生意外或有害的輸出。
- 為了降低這種風險,強烈建議使用 GUIDED 模型變體,該變體包含額外的安全機制,以確保負責任的內容生成。
- 通過選擇此變體,用戶可以顯著降低生成有害或意外內容的可能性。
- 我們計劃通過廣泛的研究更新 GUIDED 模型變體及其方法。
訓練/合併策略
您可以基於此模型進行微調、合併或訓練 LoRA。但是,為了促進開源社區的發展,您需要:
- 公開分享任何派生模型的詳細信息,包括對根據公平人工智能公共許可證許可的原始模型的引用。
- 提供用於微調或訓練的數據集和“合併配方”的信息。
- 遵守 公平人工智能公共許可證,確保任何派生作品也是開源的。
上傳/生成策略
我們不限制生成結果的任何上傳或傳播,因為我們不擁有生成材料的任何權利。這包括“個人訓練的模型 / 微調模型 / 訓練的 LoRA 相關結果”。但是,我們懇請您公開生成細節,以促進開源社區和研究的發展。
商業化禁止
- 禁止對任何 閉源微調/合併模型進行商業化,這些模型不允許公眾訪問模型的源代碼/權重及其使用方法。
- 根據許可證,您必須公開發布任何派生模型和變體。此模型旨在用於開源用途,所有派生模型必須遵循相同的原則。
使用建議
- 不建議過度使用關鍵構圖標籤,如“特寫”、“顛倒”或“牛仔視角”,因為它們可能會相互衝突並導致混淆,影響模型結果。
- 推薦的採樣方法:Euler a,採樣步數:20 - 28,CFG:5 - 7.5(可能根據使用情況有所不同)。
- 建議根據您的使用情況使用合適的構圖標籤,如“上半身”、“牛仔視角”、“肖像”或“全身”。
- 模型支持質量標籤,如:“最差質量”、“低質量”、“平均質量”、“高質量”、“最佳質量”和“傑作(質量)”。
- 注意:模型沒有任何默認風格,這是基礎模型的預期行為。
🔧 技術細節
開發歷程
當我們開始開發 Illustrious XL 系列時,目標很簡單:當時沒有適用於插畫的強大預訓練模型,所以我們決定自己構建一個——一個預訓練級別的微調模型,供藝術家和研究人員使用。我們也知道將所有內容保留在內部不會推動該領域的發展,因此我們向公眾發佈了 v0.1,並專注於訓練更新的變體,通過提高質量、深化知識和改進架構來進一步提升模型的能力。在此過程中,我們意外發現該模型不僅擅長插畫,還能理解自然語言、處理複雜提示並生成高分辨率圖像,遠遠超出了我們最初的計劃。
模型版本
- v0.1(2024 年 5 月訓練)
- v1.0(2024 年 7 月)
- v1.1(2024 年 8 月)
- v2.0(2024 年 9 月)
- v3(2024 年 11 月)
- v3.5(結合了 Google 的 v - 參數化的特殊變體)
這些模型在自然語言構圖和圖像生成方面更進一步。
未來計劃
經過幾個月的幕後工作,我們終於準備好向前邁進。我們將逐步推出最新模型,同時逐步將以前的版本開源,以便進行研究和改進。在此過程中,預計會有諸如 真正的 2K 分辨率生成 和更好的自然語言對齊等突破。
開源承諾
這需要時間,但我們正在快速推進。我們的下一代模型已經在開發中,旨在解決 SD XL 基礎架構的一些基本限制。隨著進展,舊模型自然會被棄用,並相應地發佈權重。我們的團隊旨在謹慎行事,確保每個版本都有全面的解釋和見解。
向後兼容性
我們構建的每個模型都考慮了向後兼容性,因為 Illustrious XL 不僅僅是創造新事物,更是為微調創建一個更好的基礎。這就是為什麼我們在正確訓練 LoRAs 方面投入了大量精力,不久後,我們將分享如何更有效地訓練它們的見解。
📄 許可證
本模型採用公平人工智能公共許可證 1.0 - SD(fair - ai - public - license - 1.0 - sd),許可證鏈接:[https://freedevproject.org/faipl - 1.0 - sd/](https://freedevproject.org/faipl - 1.0 - sd/)。
總結
總之,Onoma AI 計劃逐步推出開源權重,並鼓勵社區關注即將到來的發展——我們才剛剛開始。