RCNA_MINI开源模型 - 免费部署，四步实现高质量文本到视频转换

首页

RCNA MINI

由 Binarybardakshat 开发

RCNA MINI 是一款紧凑型 LoRA 模型，专为生成高质量的四步文本转视频输出而设计。

文本生成视频支持多种语言开源协议:Apache-2.0 #四步文生视频 #LoRA高效微调 #8K高分辨率

下载量 18

发布时间 : 9/29/2024

模型简介

RCNA MINI 是一款基于 LoRA 架构的文本生成视频模型，能够快速生成高质量、细节丰富的短视频片段，适用于创意内容和社交媒体。

模型特点

四步文本转视频

仅需4步即可根据文本提示生成视频，生成速度快。

高质量输出

支持高达8K的高分辨率和细节呈现，生成视频质量高。

快速采样

通过解耦一致性学习技术优化生成速度，同时保证质量。

紧凑型设计

基于LoRA架构，计算开销小，适合快速部署。

模型能力

文本生成视频

高分辨率视频生成

快速视频生成

使用案例

社交媒体

短视频动画

为社交媒体平台生成吸引人的短视频动画内容。

生成4至16秒的高质量视频片段。

创意项目

艺术视频创作

基于文本描述生成艺术视频，用于创意项目或视觉艺术。

细节丰富、过渡流畅的短动画。

🚀 RCNA MINI

RCNA MINI 是一款紧凑的 LoRA（低秩自适应）模型，专为生成高质量的 4 步文本到视频输出而设计。它可以创建时长从 4 秒到 16 秒的视频片段，非常适合生成具有丰富细节和流畅过渡的短动画。

🚀 快速开始

RCNA MINI 是基于 LoRA 架构的模型，能够根据文本描述快速生成视频。以下是使用它的示例代码：

import torch
from diffusers import AnimateDiffPipeline, LCMScheduler, MotionAdapter, DiffusionPipeline
from diffusers.utils import export_to_gif

# Load AnimateLCM for video generation
adapter = MotionAdapter.from_pretrained("Binarybardakshat/RCNA_MINI")
pipe = AnimateDiffPipeline.from_pretrained("emilianJR/epiCRealism", motion_adapter=adapter, torch_dtype=torch.float16)
pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config, beta_schedule="linear")
pipe.load_lora_weights("Binarybardakshat/RCNA_MINI", weight_name="RCNA_LORA_MINI_1.safetensors", adapter_name="lcm-lora")
pipe.set_adapters(["lcm-lora"], [0.8])
pipe.enable_vae_slicing()
pipe.enable_model_cpu_offload()

# Generate video using RCNA MINI
output = pipe(
    prompt="A space rocket with trails of smoke behind it launching into space from the desert, 4k, high resolution",
    negative_prompt="bad quality, worse quality, low resolution",
    num_frames=16,
    guidance_scale=2.0,
    num_inference_steps=6,
    generator=torch.Generator("cpu").manual_seed(0),
)
frames = output.frames[0]
export_to_gif(frames, "animatelcm.gif")
print("Video and image generation complete!")

✨ 主要特性

4 步文本到视频：仅需 4 步即可根据文本提示生成视频。
视频长度：可生成 4 秒至 16 秒长的视频。
高质量：支持高分辨率和详细的输出（最高可达 8K）。
快速采样：利用解耦一致性学习，该模型在保证质量的同时优化了速度。

💻 使用示例

基础用法

# 上述快速开始中的代码即为基础用法示例
import torch
from diffusers import AnimateDiffPipeline, LCMScheduler, MotionAdapter, DiffusionPipeline
from diffusers.utils import export_to_gif

# Load AnimateLCM for video generation
adapter = MotionAdapter.from_pretrained("Binarybardakshat/RCNA_MINI")
pipe = AnimateDiffPipeline.from_pretrained("emilianJR/epiCRealism", motion_adapter=adapter, torch_dtype=torch.float16)
pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config, beta_schedule="linear")
pipe.load_lora_weights("Binarybardakshat/RCNA_MINI", weight_name="RCNA_LORA_MINI_1.safetensors", adapter_name="lcm-lora")
pipe.set_adapters(["lcm-lora"], [0.8])
pipe.enable_vae_slicing()
pipe.enable_model_cpu_offload()

# Generate video using RCNA MINI
output = pipe(
    prompt="A space rocket with trails of smoke behind it launching into space from the desert, 4k, high resolution",
    negative_prompt="bad quality, worse quality, low resolution",
    num_frames=16,
    guidance_scale=2.0,
    num_inference_steps=6,
    generator=torch.Generator("cpu").manual_seed(0),
)
frames = output.frames[0]
export_to_gif(frames, "animatelcm.gif")
print("Video and image generation complete!")

高级用法

# 可以根据不同的需求调整参数，例如修改提示词、帧数、引导比例等
import torch
from diffusers import AnimateDiffPipeline, LCMScheduler, MotionAdapter, DiffusionPipeline
from diffusers.utils import export_to_gif

# Load AnimateLCM for video generation
adapter = MotionAdapter.from_pretrained("Binarybardakshat/RCNA_MINI")
pipe = AnimateDiffPipeline.from_pretrained("emilianJR/epiCRealism", motion_adapter=adapter, torch_dtype=torch.float16)
pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config, beta_schedule="linear")
pipe.load_lora_weights("Binarybardakshat/RCNA_MINI", weight_name="RCNA_LORA_MINI_1.safetensors", adapter_name="lcm-lora")
pipe.set_adapters(["lcm-lora"], [0.8])
pipe.enable_vae_slicing()
pipe.enable_model_cpu_offload()

# 调整提示词和帧数
output = pipe(
    prompt="A beautiful forest with colorful flowers, 8k, high resolution",
    negative_prompt="bad quality, worse quality, low resolution",
    num_frames=20,
    guidance_scale=2.5,
    num_inference_steps=8,
    generator=torch.Generator("cpu").manual_seed(1),
)
frames = output.frames[0]
export_to_gif(frames, "advanced_animatelcm.gif")
print("Advanced video and image generation complete!")