wan-flat-color-v2開源圖像生成模型 - 免費部署生成平塗色塊風格圖像

首頁

Wan Flat Color V2

由motimalu開發

基於Wan2.1-T2V-14B的LoRA模型，專為生成平塗色塊風格的圖像設計

文本生成圖像開源協議:Apache-2.0 #平塗色塊風格 #無線稿生成 #虛擬主播設計

下載量 1,071

發布時間 : 3/9/2025

模型概述

該LoRA模型用於生成無線稿可見、採用平塗色塊且幾乎沒有景深表現的圖像風格，特別適合動漫風格創作

模型特點

平塗色塊風格

生成無線稿可見、採用平塗色塊且幾乎沒有景深表現的圖像

藝術家風格融合

支持融合多位知名動漫藝術家(如米山舞、藤ちょこ等)的繪畫風格

高質量動畫支持

可生成適合Live2D動畫的高質量電影級畫面

模型能力

文本生成圖像

風格化圖像生成

動漫角色創作

場景構圖

使用案例

動漫創作

虛擬主播形象設計

生成適合虛擬主播使用的動漫風格角色形象

如示例中的星街彗星形象

場景插畫創作

創建具有特定氛圍的動漫風格場景

如星空下或櫻花樹下的少女場景

🚀 扁平色彩風格模型

本項目的扁平色彩風格模型專注於生成無可見線條畫、採用扁平色彩且幾乎無深度感的圖像和視頻。它基於特定的訓練數據，能根據輸入的文本提示生成高質量的視覺內容。

📦 模型信息

屬性	詳情
基礎模型	Wan-AI/Wan2.1-T2V-14B
觸發詞	flat color, no lineart
許可證	apache - 2.0

🔍 模型描述

扁平色彩風格模型經過訓練，可處理無可見線條畫、使用扁平色彩且深度感較弱的圖像。以下是使用 ComfyUI_examples/wan/#text-to-video 生成的文本到視頻預覽示例。加載 LoRA 時需使用 LoraLoaderModelOnly 節點。此模型信息轉載自 CivitAI：https://civitai.com/models/1132089?modelVersionId=1474944。

🎯 觸發詞

你可以使用 flat color 來觸發圖像生成。
你可以使用 no lineart 來觸發圖像生成。

📦 安裝指南

pip install git+https://github.com/huggingface/diffusers.git

💻 使用示例

基礎用法

import torch
from diffusers.utils import export_to_video
from diffusers import AutoencoderKLWan, WanPipeline
from diffusers.schedulers.scheduling_unipc_multistep import UniPCMultistepScheduler

# 可用模型: Wan-AI/Wan2.1-T2V-14B-Diffusers, Wan-AI/Wan2.1-T2V-1.3B-Diffusers
model_id = "Wan-AI/Wan2.1-T2V-14B-Diffusers"
vae = AutoencoderKLWan.from_pretrained(model_id, subfolder="vae", torch_dtype=torch.float32)
pipe = WanPipeline.from_pretrained(model_id, vae=vae, torch_dtype=torch.bfloat16)
flow_shift = 5.0  # 720P 用 5.0，480P 用 3.0
pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config, flow_shift=flow_shift)
pipe.to("cuda")

pipe.load_lora_weights("motimalu/wan-flat-color-v2")

pipe.enable_model_cpu_offload() # 適用於低顯存環境

prompt = "A cat wandering around new york city"
negative_prompt = "Bright tones, overexposed, static, blurred details, subtitles, style, works, paintings, images, static, overall gray, worst quality, low quality, JPEG compression residue, ugly, incomplete, extra fingers, poorly drawn hands, poorly drawn faces, deformed, disfigured, misshapen limbs, fused fingers, still picture, messy background, three legs, many people in the background, walking backwards"

output = pipe(
    prompt=prompt,
    negative_prompt=negative_prompt,
    height=480,
    width=720,
    num_frames=81,
    guidance_scale=5.0,
).frames[0]
export_to_video(output, "output.mp4", fps=16)