C

Consisid Preview

由BestWishYsh開發
通過頻率分解實現身份保持的文本到視頻生成模型,能夠在生成視頻時保持人物身份的一致性。
下載量 322
發布時間 : 11/26/2024

模型概述

ConsisID是一個基於THUDM/CogVideoX-5b和THUDM/CogVideoX1.5-5B-I2V微調的文本到視頻生成模型,專注於在視頻生成過程中保持人物身份的連續性。該模型通過頻率分解技術優化了面部特徵的保持能力,適用於需要高保真人物身份的視頻生成場景。

模型特點

身份保持
通過先進的頻率分解技術,在視頻生成過程中保持人物面部特徵的連續性
高質量視頻生成
能夠生成720x480分辨率、8FPS的6秒視頻
提示優化支持
對長且描述詳細的提示有良好響應,提供提示優化建議

模型能力

文本到視頻生成
面部特徵保持
動態場景生成

使用案例

影視製作
角色場景生成
為特定角色生成連貫的視頻場景
保持角色面部特徵一致的視頻序列
廣告創意
品牌代言人生成
生成品牌代言人在不同場景下的連貫視頻
身份一致的品牌宣傳視頻
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase