A

Allegro T2V 40x720P

由rhymes-ai開發
Allegro是一款開源的高質量文本到視頻生成模型,能夠生成2至6秒、15 FPS的詳細視頻,支持多種分辨率。
下載量 21
發布時間 : 12/17/2024

模型概述

Allegro是一個先進的文本到視頻生成模型,能夠根據文本提示生成高質量的視頻內容。它支持多種分辨率(368x640和720x1280),並可通過插幀技術提升至30 FPS。

模型特點

開源
完整模型權重和代碼向社區開放,採用Apache 2.0協議。
多樣化內容創作
能夠生成從人類和動物特寫到各種動態場景的廣泛內容。
高質量輸出
生成2至6秒、15 FPS、分辨率為368x640和720x1280的詳細視頻,可通過插幀至30 FPS。
輕量高效
包含1.75億參數的VideoVAE和28億參數的VideoDiT模型。支持多種精度,在BF16模式下啟用CPU卸載時僅佔用9.3 GB顯存。

模型能力

文本到視頻生成
高質量視頻合成
多樣化內容創作
視頻插幀支持

使用案例

創意內容生成
廣告視頻生成
根據產品描述生成高質量的廣告視頻。
生成2至6秒的廣告視頻,可用於社交媒體推廣。
動畫短片創作
根據故事情節生成動畫短片。
生成具有豐富細節的動畫短片,適用於創意項目。
教育
教學視頻生成
根據教學內容生成輔助視頻。
生成高質量的教學視頻,提升學習體驗。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase