text2video-zero-controlnet-canny-anime開源模型 - 免費生成動漫風格文本轉視頻，支持邊緣控制

首頁

Text2video Zero Controlnet Canny Anime

由PAIR開發

基於Text2Video-Zero的零樣本文本轉視頻生成器，專為動漫風格優化，支持邊緣引導控制

文本生成視頻開源協議:Openrail #零樣本視頻生成 #動漫風格控制 #邊緣引導生成

下載量 79

發布時間 : 3/25/2023

模型概述

該模型結合DreamBooth微調權重與ControlNet邊緣檢測技術，實現動漫風格的文本到視頻生成與編輯

模型特點

零樣本視頻生成

無需額外訓練即可從文本直接生成視頻

動漫風格優化

採用DreamBooth微調權重專門優化動漫風格輸出

邊緣引導控制

通過ControlNet實現基於邊緣檢測的條件控制

多模態輸入

支持文本+姿態/邊緣檢測等多條件組合輸入

模型能力

文本生成視頻

視頻指令編輯

姿態條件生成

邊緣檢測條件生成

動漫風格生成

使用案例

創意內容生成

動漫短視頻創作

根據文本描述自動生成動漫風格短視頻

可生成10-30秒的連貫動畫片段

視頻風格轉換

將實拍視頻轉換為動漫風格

保持原始動作的同時轉換視覺風格

影視預製作

動畫分鏡生成

快速生成動畫分鏡草稿

加速前期製作流程

🚀 文本到視頻零模型卡 - ControlNet Canny動漫風格

Text2Video-Zero 是一個零樣本的文本到視頻生成器。它可以執行 零樣本的文本到視頻生成、視頻指令圖像到圖像轉換（指令引導的視頻編輯）、文本和姿勢條件視頻生成、文本和Canny邊緣條件視頻生成，以及 文本、Canny邊緣和DreamBooth條件視頻生成。有關這項工作的更多信息，請查看我們的論文和演示：。我們的代碼可以與任何StableDiffusion基礎模型配合使用。

這個模型為文本到視頻零模型提供了適用於 動漫風格 的 DreamBooth 權重，可用於邊緣引導（使用 ControlNet）。

✨ 主要特性

實現多種文本到視頻及視頻編輯功能，如零樣本生成、指令引導編輯等。
提供動漫風格的DreamBooth權重，可用於邊緣引導。
代碼能與任何StableDiffusion基礎模型配合使用。

📚 詳細文檔

文本到視頻零模型的權重

我們將原始權重轉換為Diffusers格式，並使其可用於帶有邊緣引導的 ControlNet，具體方法參考：https://github.com/lllyasviel/ControlNet/discussions/12。

模型詳情

屬性	詳情
開發者	Levon Khachatryan、Andranik Movsisyan、Vahram Tadevosyan、Roberto Henschel、Zhangyang Wang、Shant Navasardyan和Humphrey Shi
模型類型	用於文本到視頻零模型的帶有邊緣控制的DreamBooth文本到圖像和文本到視頻生成模型
語言	英語
許可證	CreativeML OpenRAIL M許可證
模型描述	這是一個用於文本到視頻零模型的帶有邊緣引導和動漫風格的模型，也可在帶有邊緣引導的文本到圖像設置中與ControlNet一起使用。
DreamBoth關鍵詞	動漫風格
更多信息資源	GitHub、論文、CIVITAI
引用格式	@article{text2video-zero, title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators}, author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey}, journal={arXiv preprint arXiv:2303.13439}, year={2023} }

原始權重

動漫風格的DreamBooth權重取自 CIVITAI。

模型詳情

屬性	詳情
開發者	Quiet_Joker（CIVITAI上列出的用戶名）
模型類型	DreamBooth文本到圖像生成模型
語言	英語
許可證	CreativeML OpenRAIL M許可證
模型描述	這是一個使用 DreamBooth 創建的基於文本提示生成動漫風格圖像的模型。
DreamBoth關鍵詞	動漫風格
更多信息資源	CIVITAI

⚠️ 重要提示

請注意，Text2Video-Zero可能會輸出強化或加劇社會偏見的內容，以及逼真的人臉、色情內容和暴力內容。此演示中的Text2Video-Zero僅用於研究目的。

📄 許可證

本模型採用 CreativeML OpenRAIL M許可證。

📖 引用

如需引用此模型，請使用以下格式：

@article{text2video-zero,
  title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators},
  author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey},
  journal={arXiv preprint arXiv:2303.13439},
  year={2023}
}