C

Contentv 8B

ByteDanceによって開発
ContentVは高効率なビデオ生成モデルフレームワークで、極簡アーキテクチャ、多段階トレーニング戦略、経済的で効率的な強化学習フレームワークを通じて、限られた計算リソースで高品質なビデオ生成を実現します。
ダウンロード数 417
リリース時間 : 6/3/2025

モデル概要

ContentVはDiTに基づくビデオ生成モデルで、事前学習画像生成モデルの再利用、フローマッチングトレーニング戦略、人工ラベルなしの強化学習フレームワークを通じて、トレーニング効率と生成品質を大幅に向上させました。

モデル特徴

極簡アーキテクチャ
事前学習画像生成モデルを最大限に再利用してビデオ合成を行い、トレーニングコストを削減します。
多段階トレーニング戦略
体系的な多段階トレーニング戦略を採用し、フローマッチングを利用してトレーニング効率を向上させます。
経済的で効率的な強化学習
追加の人工ラベルが不要な人間フィードバックに基づく強化学習フレームワークを導入し、生成品質を向上させます。

モデル能力

テキストからビデオへの生成
高品質ビデオ合成
長時間ビデオ生成
短時間ビデオ生成

使用事例

ビデオコンテンツ作成
短時間ビデオ生成
テキスト記述に基づいて自動的に短時間ビデオコンテンツを生成します。
VBench評価で84.11点(短時間ビデオ)を獲得しました。
長時間ビデオ生成
テキスト記述に基づいて自動的に長時間ビデオコンテンツを生成します。
VBench評価で85.14点(長時間ビデオ)を獲得しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase