C

Contentv 8B

由 ByteDance 开发
ContentV是一个高效的视频生成模型框架,通过极简架构、多阶段训练策略和经济高效的强化学习框架,在有限计算资源下实现高质量视频生成。
下载量 417
发布时间 : 6/3/2025

模型简介

ContentV是一个基于DiT的视频生成模型,通过复用预训练图像生成模型、流匹配训练策略和无人工标注的强化学习框架,显著提升了训练效率和生成质量。

模型特点

极简架构
最大限度地复用预训练图像生成模型进行视频合成,降低训练成本
多阶段训练策略
采用系统的多阶段训练策略,利用流匹配提高训练效率
经济高效的强化学习
引入无需额外人工标注的基于人类反馈的强化学习框架,提高生成质量

模型能力

文本到视频生成
高质量视频合成
长视频生成
短视频生成

使用案例

视频内容创作
短视频生成
根据文本描述自动生成短视频内容
在VBench评测中取得84.11分(短视频)
长视频生成
根据文本描述自动生成长视频内容
在VBench评测中取得85.14分(长视频)
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase