🚀 文本到視頻零模型卡 - ControlNet Canny動漫風格
Text2Video-Zero 是一個零樣本的文本到視頻生成器。它可以執行 零樣本的文本到視頻生成
、視頻指令圖像到圖像轉換
(指令引導的視頻編輯)、文本和姿勢條件視頻生成
、文本和Canny邊緣條件視頻生成
,以及 文本、Canny邊緣和DreamBooth條件視頻生成
。有關這項工作的更多信息,請查看我們的 論文 和演示:
。我們的 代碼 可以與任何StableDiffusion基礎模型配合使用。
這個模型為文本到視頻零模型提供了適用於 動漫風格
的 DreamBooth 權重,可用於邊緣引導(使用 ControlNet)。
✨ 主要特性
- 實現多種文本到視頻及視頻編輯功能,如零樣本生成、指令引導編輯等。
- 提供動漫風格的DreamBooth權重,可用於邊緣引導。
- 代碼能與任何StableDiffusion基礎模型配合使用。
📚 詳細文檔
文本到視頻零模型的權重
我們將原始權重轉換為Diffusers格式,並使其可用於帶有邊緣引導的 ControlNet,具體方法參考:https://github.com/lllyasviel/ControlNet/discussions/12。
模型詳情
屬性 |
詳情 |
開發者 |
Levon Khachatryan、Andranik Movsisyan、Vahram Tadevosyan、Roberto Henschel、Zhangyang Wang、Shant Navasardyan和Humphrey Shi |
模型類型 |
用於文本到視頻零模型的帶有邊緣控制的DreamBooth文本到圖像和文本到視頻生成模型 |
語言 |
英語 |
許可證 |
CreativeML OpenRAIL M許可證 |
模型描述 |
這是一個用於 文本到視頻零模型 的帶有邊緣引導和動漫風格的模型,也可在帶有邊緣引導的文本到圖像設置中與ControlNet一起使用。 |
DreamBoth關鍵詞 |
動漫風格 |
更多信息資源 |
GitHub、論文、CIVITAI |
引用格式 |
@article{text2video-zero, title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators}, author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey}, journal={arXiv preprint arXiv:2303.13439}, year={2023} } |
原始權重
動漫風格的DreamBooth權重取自 CIVITAI。
模型詳情
⚠️ 重要提示
請注意,Text2Video-Zero可能會輸出強化或加劇社會偏見的內容,以及逼真的人臉、色情內容和暴力內容。此演示中的Text2Video-Zero僅用於研究目的。
📄 許可證
本模型採用 CreativeML OpenRAIL M許可證。
📖 引用
如需引用此模型,請使用以下格式:
@article{text2video-zero,
title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators},
author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey},
journal={arXiv preprint arXiv:2303.13439},
year={2023}
}