redshift-man-skiing开源视频生成模型 - 免费部署，用文本生成红移风格运动视频

首页

Redshift Man Skiing

由 Tune-A-Video-library 开发

基于nitrosocke/redshift-diffusion模型微调的视频生成模型，可通过文本提示生成红移风格的运动视频

视频处理开源协议:Openrail #单样本视频生成 #红移艺术风格 #运动场景转换

下载量 17

发布时间 : 2/7/2023

模型简介

该模型通过Tune-A-Video方法对基础扩散模型进行单样本调优，实现从文本到视频的生成，特别擅长生成红移风格的运动场景

模型特点

红移风格视频生成

能够生成具有独特红移艺术风格的动态视频内容

单样本调优

仅需单个训练样本即可调整基础模型，实现特定场景的视频生成

角色替换能力

保持原始动作框架的同时，可替换视频中的角色（如蜘蛛侠、蝙蝠侠等）

模型能力

文本到视频生成

风格化视频合成

角色动作迁移

使用案例

创意内容生成

超级英雄运动场景

生成各种超级英雄在红移风格下滑雪的视频

可生成如蜘蛛侠、蝙蝠侠等角色滑雪的8帧动态GIF

艺术创作

红移风格艺术视频

创建具有独特红移美学风格的短视频内容

512x512分辨率的风格化视频输出

🚀 Tune-A-Video - Redshift

Tune-A-Video - Redshift 是一个基于特定基础模型训练的项目，可用于文本到视频的生成，通过特定的训练提示，能生成如人物滑雪等风格的视频。

🚀 快速开始

克隆仓库

首先，你需要克隆 github 仓库。

git clone https://github.com/showlab/Tune-A-Video.git

运行推理代码

from tuneavideo.pipelines.pipeline_tuneavideo import TuneAVideoPipeline
from tuneavideo.models.unet import UNet3DConditionModel
from tuneavideo.util import save_videos_grid
import torch

pretrained_model_path = "nitrosocke/redshift-diffusion"
unet_model_path = "Tune-A-Video-library/redshift-man-skiing"
unet = UNet3DConditionModel.from_pretrained(unet_model_path, subfolder='unet', torch_dtype=torch.float16).to('cuda')
pipe = TuneAVideoPipeline.from_pretrained(pretrained_model_path, unet=unet, torch_dtype=torch.float16).to("cuda")
pipe.enable_xformers_memory_efficient_attention()

prompt = "(redshift style) spider man is skiing"
video = pipe(prompt, video_length=8, height=512, width=512, num_inference_steps=50, guidance_scale=7.5).videos

save_videos_grid(video, f"./{prompt}.gif")

✨ 主要特性

基于 nitrosocke/redshift-diffusion 基础模型进行训练。
通过特定的训练提示 “a man is skiing” 进行训练，可生成具有特定风格的视频。

📦 安装指南

克隆项目所需的仓库：

git clone https://github.com/showlab/Tune-A-Video.git

💻 使用示例

基础用法

from tuneavideo.pipelines.pipeline_tuneavideo import TuneAVideoPipeline
from tuneavideo.models.unet import UNet3DConditionModel
from tuneavideo.util import save_videos_grid
import torch

pretrained_model_path = "nitrosocke/redshift-diffusion"
unet_model_path = "Tune-A-Video-library/redshift-man-skiing"
unet = UNet3DConditionModel.from_pretrained(unet_model_path, subfolder='unet', torch_dtype=torch.float16).to('cuda')
pipe = TuneAVideoPipeline.from_pretrained(pretrained_model_path, unet=unet, torch_dtype=torch.float16).to("cuda")
pipe.enable_xformers_memory_efficient_attention()

prompt = "(redshift style) spider man is skiing"
video = pipe(prompt, video_length=8, height=512, width=512, num_inference_steps=50, guidance_scale=7.5).videos

save_videos_grid(video, f"./{prompt}.gif")