C

Cogvideox 5b

由vdo開發
CogVideoX是源自清影的視頻生成模型開源版本,5B版本具有更大的模型規模,能生成更高質量的視頻內容。
下載量 13
發布時間 : 8/28/2024

模型概述

CogVideoX是一個文本生成視頻的模型,能夠根據文本描述生成6秒時長的720x480分辨率視頻,幀率為每秒8幀。

模型特點

高質量視頻生成
5B參數規模提供更高質量的視頻生成效果
多精度支持
支持BF16、FP16、FP32、FP8、INT8等多種推理精度
優化顯存佔用
通過diffusers庫的優化技術降低顯存需求
固定視頻規格
生成6秒時長、720x480分辨率、8fps幀率的視頻

模型能力

文本到視頻生成
創意視頻創作
場景可視化

使用案例

創意內容生成
藝術場景生成
根據詩意描述生成藝術性視頻場景
如花園、暴雨等場景的生動呈現
故事可視化
將文字故事轉化為視頻片段
如宇航員與外星人相遇等場景
教育演示
概念可視化
將抽象概念轉化為直觀視頻
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase