Text_to_Vision开源文本转视频模型 - 免费使用，输入文本即可生成视频

首页

Text To Vision

由 Revanthraja 开发

一个使用Hugging Face Transformers库微调的文本转视频生成模型，能够根据文本输入生成视频内容。

文本生成视频开源协议:MIT #文本驱动视频生成 #多领域适配 #Transformers微调

下载量 24

发布时间 : 12/10/2023

模型简介

该模型基于Hugging Face的Transformers架构，专门用于将文本描述转化为相应的视频序列。通过对多样化数据集的微调训练，能够理解并可视化各种文本提示，生成相关的视频内容。

模型特点

文本到视频转换

能够将文本输入转换为对应的视频序列，实现文本描述的可视化。

多领域数据集微调

使用Hugging Face Transformers在多领域数据集上进行微调，提高模型的泛化能力。

多样化内容生成

能够根据文本描述生成多样化的视频内容，处理具有细微差别的文本提示。

模型能力

文本到视频生成

多领域内容理解

视频序列生成

使用案例

内容创作

短视频生成

根据文本描述自动生成短视频内容

快速生成符合描述的短视频片段

教育视频制作

将教育内容文本转换为可视化视频

提高教育内容的吸引力和理解度

广告营销

广告视频生成

根据产品描述生成广告视频

快速制作多样化广告素材

属性	详情
模型类型	文本到视频生成模型
训练数据	多种数据集

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Text To Vision

模型简介

模型特点

模型能力

使用案例

🚀 文本到视频模型与Hugging Face Transformers

🚀 快速开始

✨ 主要特性

📄 许可证