L

Latte 1

由maxin-cn開發
Latte是一個基於Transformer的潛在擴散模型,專注於文本生成視頻任務,支持多種數據集預訓練權重。
下載量 1,027
發布時間 : 6/3/2024

模型概述

Latte是一個基於Transformer架構的潛在擴散模型,主要用於文本生成視頻任務。它支持從文本輸入生成高質量視頻內容,並提供了多種數據集的預訓練權重。

模型特點

文本生成視頻
支持從文本描述生成高質量視頻內容
多數據集支持
提供FaceForensics、SkyTimelapse、UCF101和Taichi-HD等多種數據集的預訓練權重
Transformer架構
採用基於Transformer的潛在擴散模型架構
文本生成圖像功能
最新版本Latte-1同時支持文本生成圖像功能

模型能力

文本生成視頻
文本生成圖像

使用案例

視頻創作
創意視頻生成
根據文本描述自動生成創意視頻內容
可生成高質量的視頻片段
教育
教學視頻生成
根據教學內容自動生成演示視頻
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase