RepVideo開源視頻生成模型 - 重新思考跨層表示，免費提升視頻生成質量

首頁

Repvideo

由Vchitect開發

RepVideo是一個創新的視頻生成模型，通過重新思考跨層表示來提升視頻生成質量。

文本生成視頻開源協議:Apache-2.0 #文本生成視頻 #跨層表示 #高保真視頻生成

下載量 0

發布時間 : 1/14/2025

模型概述

RepVideo專注於改進視頻生成過程中的跨層表示，通過創新的架構設計提升生成視頻的質量和連貫性。

模型特點

跨層表示優化

通過重新思考視頻生成過程中的跨層表示，提升生成視頻的質量和連貫性

高質量視頻生成

能夠生成高質量、連貫的視頻內容

開源許可

採用Apache-2.0許可證，允許學術研究和商業使用

模型能力

文本到視頻生成

高質量視頻合成

多場景視頻創作

使用案例

創意內容生成

動畫製作

根據文本描述生成動畫視頻

展示畫廊中的高質量動畫示例

廣告製作

快速生成產品展示視頻

教育

教學視頻生成

根據教學內容自動生成演示視頻

🚀 RepVideo：重新思考視頻生成的跨層表示

RepVideo 是一個專注於視頻生成的項目，它重新思考了跨層表示在視頻生成中的應用，為視頻生成領域帶來了新的思路和方法。

🚀 快速開始

安裝

1. 創建 conda 環境並下載模型

conda create -n RepVid python==3.10
conda activate RepVid
pip install -r requirements.txt

mkdir ckpt
cd ckpt
mkdir t5-v1_1-xxl
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/config.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model-00001-of-00002.safetensors
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model-00002-of-00002.safetensors
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model.safetensors.index.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/added_tokens.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/special_tokens_map.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/spiece.model
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/tokenizer_config.json

cd ../
mkdir vae
wget https://cloud.tsinghua.edu.cn/f/fdba7608a49c463ba754/?dl=1
mv 'index.html?dl=1' vae.zip
unzip vae.zip

推理

cd sat
bash run.sh

✨ 主要特性

跨層表示創新：重新思考了跨層表示在視頻生成中的應用，為視頻生成帶來新的方法。
開源框架：代碼採用 Apache 2.0 許可證，完全開放用於學術研究，也允許免費商業使用。

📦 安裝指南

1. 創建 conda 環境並下載模型

conda create -n RepVid python==3.10
conda activate RepVid
pip install -r requirements.txt

mkdir ckpt
cd ckpt
mkdir t5-v1_1-xxl
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/config.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model-00001-of-00002.safetensors
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model-00002-of-00002.safetensors
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model.safetensors.index.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/added_tokens.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/special_tokens_map.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/spiece.model
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/tokenizer_config.json

cd ../
mkdir vae
wget https://cloud.tsinghua.edu.cn/f/fdba7608a49c463ba754/?dl=1
mv 'index.html?dl=1' vae.zip
unzip vae.zip

💻 使用示例

推理

cd sat
bash run.sh

📚 詳細文檔

作者信息

Si, Chenyang^1†, Fan, Weichen^1†, Lv, Zhengyao², Huang, Ziqi¹, Qiao, Yu², Liu, Ziwei^1✉

S-Lab, Nanyang Technological University¹ Shanghai Artificial Intelligence Laboratory ²
^†同等貢獻。 ^✉通訊作者。

效果展示

📄 許可證

本代碼採用 Apache 2.0 許可證。該框架完全開放用於學術研究，也允許免費商業使用。

免責聲明

我們對用戶生成的內容不承擔責任。該模型並非用於真實地呈現人物或事件，因此使用它生成此類內容超出了模型的能力範圍。禁止使用該模型生成色情、暴力和血腥內容，以及生成貶低或傷害他人或其環境、文化、宗教等的內容。用戶對自己的行為負全部責任。項目貢獻者與用戶的行為在法律上沒有關聯，也不對用戶的行為負責。請負責任地使用生成模型，遵守道德和法律標準。

BibTeX

@article{si2025RepVideo,
  title={RepVideo: Rethinking Cross-Layer Representation for Video Generation},
  author={Si, Chenyang and Fan, Weichen and Lv, Zhengyao and Huang, Ziqi and Qiao, Yu and Liu, Ziwei},
  journal={arXiv 2501.08994},
  year={2025}
}