wan-14b-cyberpunk-realistic开源视频模型 - 免费生成赛博朋克风格视频

首页

Wan 14b Cyberpunk Realistic

由 fofr 开发

基于Wan2.1 14B视频生成模型训练的LoRA适配器，专为赛博朋克风格视频生成优化

视频处理支持多种语言开源协议:Apache-2.0 #LoRA适配视频生成 #赛博朋克风格化 #图像到视频转换

下载量 15

发布时间 : 3/12/2025

模型简介

该模型是一个图像转视频的LoRA适配器，能够将静态图像转换为具有赛博朋克风格的动态视频内容。

模型特点

赛博朋克风格优化

通过LoRA适配器专门优化了赛博朋克风格的视频生成效果

双框架兼容

兼容Diffusers和ComfyUI框架，可加载至Wan2.1的文本转视频和图像转视频双模型

触发词控制

使用'CYB77'或'CYB77风格'触发词可激活特定视频生成特性

模型能力

图像转视频

文本转视频

风格化视频生成

使用案例

创意内容生成

赛博朋克风格视频创作

将静态图像转换为具有赛博朋克风格的动态视频

示例视频链接：https://replicate.delivery/xezq/ByLxPmW5pz6cKNFgMvoN34o0m7MecRlYeToujGw97KlvtKbUA/R8_Wan_00001.mp4

🚀 Wan 14B 赛博朋克写实风格（图像转视频）

本项目是一个图像转视频的模型，基于LoRA技术对Wan2.1 14b视频生成模型进行优化，可用于生成具有赛博朋克写实风格的视频。

🚀 快速开始

关于此LoRA

这是适用于Wan2.1 14b视频生成模型的 LoRA。它可以与Diffusers或ComfyUI配合使用，并且可以加载到文本转视频和图像转视频的Wan2.1模型中。该模型在 Replicate 上使用AI工具包进行训练：https://replicate.com/ostris/wan-lora-trainer/train 。

触发词

你应该使用 CYB77 或 “In the style of CYB77” 来触发视频生成。

使用此LoRA

Replicate 有一系列针对速度和成本进行优化的Wan2.1模型，它们也可以与此LoRA一起使用：

https://replicate.com/collections/wan-video
https://replicate.com/fofr/wan2.1-with-lora

使用Replicate的API运行此LoRA

import replicate

input = {
    "prompt": "CYB77",
    "image": "https://replicate.delivery/xezq/4BGR8w4ELvJfcqIG4KIF0Kr82JxtfQCM2xVAIUieSeifmTZjC/output_frame.jpg",
    "lora_url": "https://huggingface.co/fofr/wan-14b-cyberpunk-realistic/resolve/main/wan-14b-i2v-cyberpunk-realistic-lora.safetensors"
}

output = replicate.run(
    "fofr/wan2.1-with-lora:f83b84064136a38415a3aff66c326f94c66859b8ad7a2cb432e2822774f07b08",
    model="14b",
    input=input
)
for index, item in enumerate(output):
    with open(f"output_{index}.mp4", "wb") as file:
        file.write(item.read())

与Diffusers一起使用

pip install git+https://github.com/huggingface/diffusers.git

import torch
from diffusers.utils import export_to_video
from diffusers import AutoencoderKLWan, WanPipeline
from diffusers.schedulers.scheduling_unipc_multistep import UniPCMultistepScheduler

model_id = "Wan-AI/Wan2.1-T2V-14B-Diffusers"
vae = AutoencoderKLWan.from_pretrained(model_id, subfolder="vae", torch_dtype=torch.float32)
pipe = WanPipeline.from_pretrained(model_id, vae=vae, torch_dtype=torch.bfloat16)
flow_shift = 3.0  # 5.0 for 720P, 3.0 for 480P
pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config, flow_shift=flow_shift)
pipe.to("cuda")

pipe.load_lora_weights("fofr/wan-14b-cyberpunk-realistic")

pipe.enable_model_cpu_offload() #for low-vram environments

prompt = "CYB77"
negative_prompt = "Bright tones, overexposed, static, blurred details, subtitles, style, works, paintings, images, static, overall gray, worst quality, low quality, JPEG compression residue, ugly, incomplete, extra fingers, poorly drawn hands, poorly drawn faces, deformed, disfigured, misshapen limbs, fused fingers, still picture, messy background, three legs, many people in the background, walking backwards"

output = pipe(
    prompt=prompt,
    negative_prompt=negative_prompt,
    height=480,
    width=832,
    num_frames=81,
    guidance_scale=5.0,
).frames[0]
export_to_video(output, "output.mp4", fps=16)