🚀 RepVideo:重新思考視頻生成的跨層表示
RepVideo 是一個專注於視頻生成的項目,它重新思考了跨層表示在視頻生成中的應用,為視頻生成領域帶來了新的思路和方法。
🚀 快速開始
安裝
1. 創建 conda 環境並下載模型
conda create -n RepVid python==3.10
conda activate RepVid
pip install -r requirements.txt
mkdir ckpt
cd ckpt
mkdir t5-v1_1-xxl
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/config.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model-00001-of-00002.safetensors
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model-00002-of-00002.safetensors
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model.safetensors.index.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/added_tokens.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/special_tokens_map.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/spiece.model
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/tokenizer_config.json
cd ../
mkdir vae
wget https://cloud.tsinghua.edu.cn/f/fdba7608a49c463ba754/?dl=1
mv 'index.html?dl=1' vae.zip
unzip vae.zip
推理
cd sat
bash run.sh
✨ 主要特性
- 跨層表示創新:重新思考了跨層表示在視頻生成中的應用,為視頻生成帶來新的方法。
- 開源框架:代碼採用 Apache 2.0 許可證,完全開放用於學術研究,也允許免費商業使用。
📦 安裝指南
1. 創建 conda 環境並下載模型
conda create -n RepVid python==3.10
conda activate RepVid
pip install -r requirements.txt
mkdir ckpt
cd ckpt
mkdir t5-v1_1-xxl
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/config.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model-00001-of-00002.safetensors
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model-00002-of-00002.safetensors
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/text_encoder/model.safetensors.index.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/added_tokens.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/special_tokens_map.json
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/spiece.model
wget https://huggingface.co/THUDM/CogVideoX-2b/resolve/main/tokenizer/tokenizer_config.json
cd ../
mkdir vae
wget https://cloud.tsinghua.edu.cn/f/fdba7608a49c463ba754/?dl=1
mv 'index.html?dl=1' vae.zip
unzip vae.zip
💻 使用示例
推理
cd sat
bash run.sh
📚 詳細文檔
作者信息
Si, Chenyang1†,
Fan, Weichen1†,
Lv, Zhengyao2,
Huang, Ziqi1,
Qiao, Yu2,
Liu, Ziwei1✉
S-Lab, Nanyang Technological University1 Shanghai Artificial Intelligence Laboratory 2
†同等貢獻。 ✉通訊作者。
相關鏈接
效果展示
📄 許可證
本代碼採用 Apache 2.0 許可證。該框架完全開放用於學術研究,也允許免費商業使用。
免責聲明
我們對用戶生成的內容不承擔責任。該模型並非用於真實地呈現人物或事件,因此使用它生成此類內容超出了模型的能力範圍。禁止使用該模型生成色情、暴力和血腥內容,以及生成貶低或傷害他人或其環境、文化、宗教等的內容。用戶對自己的行為負全部責任。項目貢獻者與用戶的行為在法律上沒有關聯,也不對用戶的行為負責。請負責任地使用生成模型,遵守道德和法律標準。
BibTeX
@article{si2025RepVideo,
title={RepVideo: Rethinking Cross-Layer Representation for Video Generation},
author={Si, Chenyang and Fan, Weichen and Lv, Zhengyao and Huang, Ziqi and Qiao, Yu and Liu, Ziwei},
journal={arXiv 2501.08994},
year={2025}
}