🚀 Wan2.1-T2V-14B 舊書插畫LoRA
本項目是一個基於LoRA(Low-Rank Adaptation)技術的文本到視頻模型適配器,它能讓你生成具有舊書插畫風格的視頻。通過在特定數據集上的訓練,該適配器為Wan2.1-T2V-14B模型賦予了獨特的圖像生成能力。
🚀 快速開始
使用Diffusers庫
首先,你需要安裝diffusers
庫:
pip install git+https://github.com/huggingface/diffusers.git
然後,使用以下代碼生成視頻:
import torch
from diffusers.utils import export_to_video
from diffusers import AutoencoderKLWan, WanPipeline
from diffusers.schedulers.scheduling_unipc_multistep import UniPCMultistepScheduler
model_id = "Wan-AI/Wan2.1-T2V-14B-Diffusers"
vae = AutoencoderKLWan.from_pretrained(model_id, subfolder="vae", torch_dtype=torch.float32)
pipe = WanPipeline.from_pretrained(model_id, vae=vae, torch_dtype=torch.bfloat16)
pipe.scheduler = UniPCMultistepScheduler.from_config(
pipe.scheduler.config,
flow_shift=5.0
)
pipe.to("cuda")
pipe.load_lora_weights("AdamLucek/Wan2.1-T2V-14B-OldBookIllustrations")
pipe.enable_model_cpu_offload()
prompt = "An old book illustration of a dog walking down a path"
negative_prompt = "色調豔麗,過曝,靜態,細節模糊不清,字幕,風格,作品,畫作,畫面,靜止,整體發灰,最差質量,低質量,JPEG壓縮殘留,醜陋的,殘缺的,多餘的手指,畫得不好的手部,畫得不好的臉部,畸形的,毀容的,形態畸形的肢體,手指融合,靜止不動的畫面,雜亂的背景,三條腿,背景人很多,倒著走"
output = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
height=720,
width=1280,
num_frames=81,
guidance_scale=5.0,
num_inference_steps=32
).frames[0]
export_to_video(output, "output.mp4", fps=16)
使用ComfyUI
你可以使用提供的ComfyUI工作流文件 oldbookillustration_workflow.json。
為了快速下載推薦的文本編碼器、VAE和Wan2.1文件,請運行以下命令:
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/diffusion_models/wan2.1_t2v_14B_bf16.safetensors
✨ 主要特性
- 特定風格生成:基於Wan-AI/Wan2.1-T2V-14B文本到視頻模型,訓練出能生成舊書插畫風格視頻的LoRA適配器。
- 觸發詞機制:使用
An old book illustration of a
作為觸發詞,方便快捷地生成所需風格的圖像。
📦 安裝指南
使用Diffusers庫時,通過以下命令安裝所需庫:
pip install git+https://github.com/huggingface/diffusers.git
💻 使用示例
基礎用法
在使用Diffusers庫時,按照上述“使用Diffusers庫”部分的代碼示例,即可生成具有舊書插畫風格的視頻。
高級用法
你可以根據自己的需求調整代碼中的參數,如height
、width
、num_frames
、guidance_scale
和num_inference_steps
等,以獲得不同效果的視頻。
📚 詳細文檔
模型描述
本LoRA適配器是為Wan-AI/Wan2.1-T2V-14B文本到視頻模型設計的,它在AdamLucek/oldbookillustrations-small數據集的一個子集圖像上進行了訓練。
觸發詞
你應該使用An old book illustration of a
來觸發圖像生成。
下載模型
該模型的權重以Safetensors格式提供。你可以在“Files & versions”標籤頁中 下載 它們。
📄 許可證
本項目採用MIT許可證。