df-cpt-mo-di-bear-guitar開源模型 - 根據文本提示生成現代迪士尼風格視頻

首頁

Df Cpt Mo Di Bear Guitar

由Tune-A-Video-library開發

這是一個基於nitrosocke/mo-di-diffusion模型的文本生成視頻模型，能夠根據文本提示生成現代迪士尼風格的視頻內容。

文本生成視頻開源協議:Openrail #文本生成視頻 #迪士尼風格 #單樣本調優

下載量 16

發布時間 : 6/9/2023

模型概述

該模型通過Tune-A-Video技術對基礎圖像擴散模型進行調優，實現從文本到視頻的生成功能，特別擅長生成現代迪士尼風格的動態內容。

模型特點

現代迪士尼風格

能夠生成具有現代迪士尼藝術風格的視頻內容

文本到視頻轉換

根據簡單的文本提示生成連貫的視頻序列

基於Tune-A-Video技術

通過一次性調優實現圖像擴散模型到視頻生成模型的轉換

模型能力

文本生成視頻

風格化視頻生成

動態內容創作

使用案例

創意內容生成

動畫角色表演

生成迪士尼風格角色表演特定動作的視頻

示例中展示了公主彈吉他的動畫效果

概念演示

快速可視化創意概念

原始訓練展示了熊彈吉他的動畫

藝術創作

風格化動畫

生成特定藝術風格的短視頻片段

現代迪士尼風格的動畫輸出

🚀 Tune-A-Video - 現代迪士尼風格

本項目是一個與Diffusers兼容的模型，可用於文本到視頻的生成，基於現代迪士尼風格，通過特定訓練提示進行訓練，能生成具有特色的視頻內容。

🚀 快速開始

本模型是一個與Diffusers兼容的檢查點。當與DiffusionPipeline一起使用時，會返回一個TuneAVideoPipeline實例。

df-cpt 用於表示它是Tune-A-Video-library/mo-di-bear-guitar的Diffusers兼容版本。

基礎模型：nitrosocke/mo-di-diffusion
訓練提示：一隻熊在彈吉他。

✨ 主要特性

與Diffusers庫兼容，方便集成到現有的擴散模型流程中。
基於現代迪士尼風格，能生成具有該風格特色的視頻內容。

💻 使用示例

基礎用法

使用現有的文本到圖像檢查點加載

import torch
from diffusers import TuneAVideoPipeline, DDIMScheduler, UNet3DConditionModel
from diffusers.utils import export_to_video
from PIL import Image

# Use any pretrained Text2Image checkpoint based on stable diffusion
pretrained_model_path = "nitrosocke/mo-di-diffusion"
unet = UNet3DConditionModel.from_pretrained(
    "Tune-A-Video-library/df-cpt-mo-di-bear-guitar", subfolder="unet", torch_dtype=torch.float16
).to("cuda")

pipe = TuneAVideoPipeline.from_pretrained(pretrained_model_path, unet=unet, torch_dtype=torch.float16).to("cuda")

prompt = "A princess playing a guitar, modern disney style"
generator = torch.Generator(device="cuda").manual_seed(42)

video_frames = pipe(prompt, video_length=3, generator=generator, num_inference_steps=50, output_type="np").frames

# Saving to gif.
pil_frames = [Image.fromarray(frame) for frame in video_frames]
duration = len(pil_frames) / 8
pil_frames[0].save(
    "animation.gif",
    save_all=True,
    append_images=pil_frames[1:],  # append rest of the images
    duration=duration * 1000,  # in milliseconds
    loop=0,
)

# Saving to video
video_path = export_to_video(video_frames)

高級用法

加載已保存的Tune-A-Video檢查點

import torch
from diffusers import DiffusionPipeline, DDIMScheduler
from diffusers.utils import export_to_video
from PIL import Image

pipe = DiffusionPipeline.from_pretrained(
    "Tune-A-Video-library/df-cpt-mo-di-bear-guitar", torch_dtype=torch.float16
).to("cuda")

prompt = "A princess playing a guitar, modern disney style"
generator = torch.Generator(device="cuda").manual_seed(42)

video_frames = pipe(prompt, video_length=3, generator=generator, num_inference_steps=50, output_type="np").frames

# Saving to gif.
pil_frames = [Image.fromarray(frame) for frame in video_frames]
duration = len(pil_frames) / 8
pil_frames[0].save(
    "animation.gif",
    save_all=True,
    append_images=pil_frames[1:],  # append rest of the images
    duration=duration * 1000,  # in milliseconds
    loop=0,
)

# Saving to video
video_path = export_to_video(video_frames)