Tune - A - VideKO - disney開源模型 - 單樣本微調生成迪士尼風格特定動作視頻

首頁

Tune A VideKO Disney

由kyujinpy開發

基於迪士尼風格的文本生成視頻模型，通過單樣本微調實現特定動作的視頻生成

文本生成視頻開源協議:Openrail #迪士尼風格視頻生成 #單樣本微調 #韓語支持

下載量 44

發布時間 : 8/16/2023

模型概述

該模型是基於Tune-A-Video框架開發的文本到視頻生成模型，特別針對迪士尼風格進行了優化。它能夠根據文本提示生成具有特定動作（如彈吉他）的短視頻片段。

模型特點

迪士尼風格視頻生成

專門針對現代迪士尼風格優化的視頻生成能力

單樣本微調

僅需單個樣本即可微調模型生成特定動作的視頻

動作保持

能夠保持訓練樣本中的基礎動作（如彈吉他）同時改變主體

模型能力

文本到視頻生成

迪士尼風格渲染

動作保持轉換

使用案例

創意內容生成

卡通角色動畫

為迪士尼風格角色生成特定動作的短視頻

可生成如熊、兔子、獅子等不同角色彈吉他的動畫

概念演示

快速生成創意概念的視覺演示

可用於前期創意展示或概念驗證

🚀 Tune-A-VideKO-anything

Tune-A-VideKO-anything是一個基於特定基礎模型訓練的文本到視頻生成模型，能依據輸入的文本生成具有現代迪士尼風格的視頻，可應用於創意視頻製作等場景。

🚀 快速開始

克隆代碼倉庫

git clone https://github.com/showlab/Tune-A-Video.git

運行推理代碼

from tuneavideo.pipelines.pipeline_tuneavideo import TuneAVideoPipeline
from tuneavideo.models.unet import UNet3DConditionModel
from tuneavideo.util import save_videos_grid
import torch

pretrained_model_path = "kyujinpy/KO-stable-diffusion-disney"
unet_model_path = "kyujinpy/Tune-A-VideKO-disney"
unet = UNet3DConditionModel.from_pretrained(unet_model_path, subfolder='unet', torch_dtype=torch.float16).to('cuda')
pipe = TuneAVideoPipeline.from_pretrained(pretrained_model_path, unet=unet, torch_dtype=torch.float16).to("cuda")
pipe.enable_xformers_memory_efficient_attention()

prompt = "사자가 기타를 치고 있습니다, 모던한 디즈니 스타일"
video = pipe(prompt, video_length=14, height=512, width=512, num_inference_steps=50, guidance_scale=7.5).videos

save_videos_grid(video, f"./{prompt}.gif")

✨ 主要特性

特定基礎模型：基於 kyujinpy/KO-stable-diffusion-disney 模型進行訓練。
特定訓練提示：使用 “A bear is playing guitar” 進行訓練。
多場景生成：能根據不同的測試提示，如兔子、王子、獅子彈吉他等，生成具有現代迪士尼風格的視頻。

📦 安裝指南

克隆項目代碼倉庫：

git clone https://github.com/showlab/Tune-A-Video.git

💻 使用示例

基礎用法

from tuneavideo.pipelines.pipeline_tuneavideo import TuneAVideoPipeline
from tuneavideo.models.unet import UNet3DConditionModel
from tuneavideo.util import save_videos_grid
import torch

pretrained_model_path = "kyujinpy/KO-stable-diffusion-disney"
unet_model_path = "kyujinpy/Tune-A-VideKO-disney"
unet = UNet3DConditionModel.from_pretrained(unet_model_path, subfolder='unet', torch_dtype=torch.float16).to('cuda')
pipe = TuneAVideoPipeline.from_pretrained(pretrained_model_path, unet=unet, torch_dtype=torch.float16).to("cuda")
pipe.enable_xformers_memory_efficient_attention()

prompt = "사자가 기타를 치고 있습니다, 모던한 디즈니 스타일"
video = pipe(prompt, video_length=14, height=512, width=512, num_inference_steps=50, guidance_scale=7.5).videos

save_videos_grid(video, f"./{prompt}.gif")