text2video-zero-controlnet-canny-anime开源模型 - 免费生成动漫风格文本转视频，支持边缘控制

首页

Text2video Zero Controlnet Canny Anime

由 PAIR 开发

基于Text2Video-Zero的零样本文本转视频生成器，专为动漫风格优化，支持边缘引导控制

文本生成视频开源协议:Openrail #零样本视频生成 #动漫风格控制 #边缘引导生成

下载量 79

发布时间 : 3/25/2023

模型简介

该模型结合DreamBooth微调权重与ControlNet边缘检测技术，实现动漫风格的文本到视频生成与编辑

模型特点

零样本视频生成

无需额外训练即可从文本直接生成视频

动漫风格优化

采用DreamBooth微调权重专门优化动漫风格输出

边缘引导控制

通过ControlNet实现基于边缘检测的条件控制

多模态输入

支持文本+姿态/边缘检测等多条件组合输入

模型能力

文本生成视频

视频指令编辑

姿态条件生成

边缘检测条件生成

动漫风格生成

使用案例

创意内容生成

动漫短视频创作

根据文本描述自动生成动漫风格短视频

可生成10-30秒的连贯动画片段

视频风格转换

将实拍视频转换为动漫风格

保持原始动作的同时转换视觉风格

影视预制作

动画分镜生成

快速生成动画分镜草稿

加速前期制作流程

🚀 文本到视频零模型卡 - ControlNet Canny动漫风格

Text2Video-Zero 是一个零样本的文本到视频生成器。它可以执行 零样本的文本到视频生成、视频指令图像到图像转换（指令引导的视频编辑）、文本和姿势条件视频生成、文本和Canny边缘条件视频生成，以及 文本、Canny边缘和DreamBooth条件视频生成。有关这项工作的更多信息，请查看我们的论文和演示：。我们的代码可以与任何StableDiffusion基础模型配合使用。

这个模型为文本到视频零模型提供了适用于 动漫风格 的 DreamBooth 权重，可用于边缘引导（使用 ControlNet）。

✨ 主要特性

实现多种文本到视频及视频编辑功能，如零样本生成、指令引导编辑等。
提供动漫风格的DreamBooth权重，可用于边缘引导。
代码能与任何StableDiffusion基础模型配合使用。

📚 详细文档

文本到视频零模型的权重

我们将原始权重转换为Diffusers格式，并使其可用于带有边缘引导的 ControlNet，具体方法参考：https://github.com/lllyasviel/ControlNet/discussions/12。

模型详情

属性	详情
开发者	Levon Khachatryan、Andranik Movsisyan、Vahram Tadevosyan、Roberto Henschel、Zhangyang Wang、Shant Navasardyan和Humphrey Shi
模型类型	用于文本到视频零模型的带有边缘控制的DreamBooth文本到图像和文本到视频生成模型
语言	英语
许可证	CreativeML OpenRAIL M许可证
模型描述	这是一个用于文本到视频零模型的带有边缘引导和动漫风格的模型，也可在带有边缘引导的文本到图像设置中与ControlNet一起使用。
DreamBoth关键词	动漫风格
更多信息资源	GitHub、论文、CIVITAI
引用格式	@article{text2video-zero, title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators}, author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey}, journal={arXiv preprint arXiv:2303.13439}, year={2023} }

原始权重

动漫风格的DreamBooth权重取自 CIVITAI。

模型详情

属性	详情
开发者	Quiet_Joker（CIVITAI上列出的用户名）
模型类型	DreamBooth文本到图像生成模型
语言	英语
许可证	CreativeML OpenRAIL M许可证
模型描述	这是一个使用 DreamBooth 创建的基于文本提示生成动漫风格图像的模型。
DreamBoth关键词	动漫风格
更多信息资源	CIVITAI

⚠️ 重要提示

请注意，Text2Video-Zero可能会输出强化或加剧社会偏见的内容，以及逼真的人脸、色情内容和暴力内容。此演示中的Text2Video-Zero仅用于研究目的。

📄 许可证

本模型采用 CreativeML OpenRAIL M许可证。

📖 引用

如需引用此模型，请使用以下格式：

@article{text2video-zero,
  title={Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators},
  author={Khachatryan, Levon and Movsisyan, Andranik and Tadevosyan, Vahram and Henschel, Roberto and Wang, Zhangyang and Navasardyan, Shant and Shi, Humphrey},
  journal={arXiv preprint arXiv:2303.13439},
  year={2023}
}