V

Vqvae

Developed by hpcai-tech
VQVAE是基於VQ-VAE架構的視頻生成模型,克隆自VideoGPT項目,旨在將模型轉換為Hugging Face格式以便更便捷地加載。
Downloads 179
Release Time : 2/20/2024

Model Overview

該模型基於VQ-VAE(向量量化變分自編碼器)架構,專注於視頻生成任務,通過將視頻數據編碼為離散潛在表示來實現高效生成。

Model Features

高效視頻表示
通過VQ-VAE架構將視頻編碼為離散潛在表示,實現高效存儲和處理。
Hugging Face兼容
模型已轉換為Hugging Face格式,便於在Hugging Face生態系統中加載和使用。
視頻生成能力
能夠基於潛在表示生成高質量的視頻內容。

Model Capabilities

視頻編碼
視頻生成
潛在表示學習

Use Cases

創意內容生成
短視頻生成
生成創意短視頻內容
可生成具有連貫性的短視頻序列
數據增強
視頻數據擴充
為視頻識別任務生成額外的訓練數據
可擴展有限視頻數據集
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase