C

Consisid Preview

BestWishYshによって開発
周波数分解によるアイデンティティ保持を実現したテキストから動画を生成するモデルで、動画生成時に人物のアイデンティティの一貫性を保持できます。
ダウンロード数 322
リリース時間 : 11/26/2024

モデル概要

ConsisIDはTHUDM/CogVideoX-5bとTHUDM/CogVideoX1.5-5B-I2Vをファインチューニングしたテキストから動画を生成するモデルで、動画生成プロセス中の人物アイデンティティの連続性保持に特化しています。このモデルは周波数分解技術により顔特徴の保持能力を最適化し、高忠実度な人物アイデンティティが必要な動画生成シナリオに適しています。

モデル特徴

アイデンティティ保持
先進的な周波数分解技術により、動画生成プロセス中に人物の顔特徴の連続性を保持
高品質動画生成
720x480解像度、8FPSの6秒間動画を生成可能
プロンプト最適化サポート
長く詳細な説明のプロンプトに良好に反応し、プロンプト最適化の提案を提供

モデル能力

テキストから動画生成
顔特徴保持
動的シーン生成

使用事例

映像制作
キャラクターシーン生成
特定のキャラクターに対して一貫性のある動画シーンを生成
キャラクターの顔特徴が一貫した動画シーケンス
広告クリエイティブ
ブランド広告タレント生成
ブランド広告タレントの異なるシーンでの一貫性のある動画を生成
アイデンティティが一貫したブランドプロモーション動画
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase