C

Cogvideox Fun 2b InP

alibaba-paiによって開発
CogVideoXアーキテクチャを改良した動画生成モデルで、テキスト/画像から動画への変換やマルチ解像度生成をサポート
ダウンロード数 52
リリース時間 : 9/18/2024

モデル概要

CogVideoXファン版はCogVideoXアーキテクチャを改良した生成パイプラインで、より自由な生成条件を提供し、AI画像/動画作成、Diffusion TransformerベースモデルおよびLoraモデルのトレーニングに使用可能。事前学習済みモデルを直接ロードして約6秒(1〜49フレーム、8fps)のマルチ解像度動画を生成できるほか、ユーザーが個性的なスタイルモデルをトレーニングすることも可能。

モデル特徴

マルチ解像度対応
256x256から1024x1024までの任意の解像度で動画生成をサポート
長尺動画生成
約6秒(1〜49フレーム、8fps)の動画を生成可能
パーソナライズドトレーニング
ユーザーが個性的なスタイルモデルやLoraモデルをトレーニング可能
マルチプラットフォーム展開
Windows/Linuxシステムをサポートし、クラウドDSW/Docker展開ソリューションを提供

モデル能力

テキストから動画
画像から動画
動画スタイル転送
パーソナライズド動画生成

使用事例

クリエイティブコンテンツ生成
AIアート創作
テキスト記述に基づいてクリエイティブな動画コンテンツを生成
約6秒のクリエイティブ動画
ショート動画制作
静止画像を動画に変換
8fpsのスムーズなショート動画
パーソナライズドトレーニング
スタイリッシュ動画生成
特定のスタイルの動画生成モデルをトレーニング
個性的なスタイルの動画出力
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase