Contentv 8B
ContentVは高効率なビデオ生成モデルフレームワークで、極簡アーキテクチャ、多段階トレーニング戦略、経済的で効率的な強化学習フレームワークを通じて、限られた計算リソースで高品質なビデオ生成を実現します。
ダウンロード数 417
リリース時間 : 6/3/2025
モデル概要
ContentVはDiTに基づくビデオ生成モデルで、事前学習画像生成モデルの再利用、フローマッチングトレーニング戦略、人工ラベルなしの強化学習フレームワークを通じて、トレーニング効率と生成品質を大幅に向上させました。
モデル特徴
極簡アーキテクチャ
事前学習画像生成モデルを最大限に再利用してビデオ合成を行い、トレーニングコストを削減します。
多段階トレーニング戦略
体系的な多段階トレーニング戦略を採用し、フローマッチングを利用してトレーニング効率を向上させます。
経済的で効率的な強化学習
追加の人工ラベルが不要な人間フィードバックに基づく強化学習フレームワークを導入し、生成品質を向上させます。
モデル能力
テキストからビデオへの生成
高品質ビデオ合成
長時間ビデオ生成
短時間ビデオ生成
使用事例
ビデオコンテンツ作成
短時間ビデオ生成
テキスト記述に基づいて自動的に短時間ビデオコンテンツを生成します。
VBench評価で84.11点(短時間ビデオ)を獲得しました。
長時間ビデオ生成
テキスト記述に基づいて自動的に長時間ビデオコンテンツを生成します。
VBench評価で85.14点(長時間ビデオ)を獲得しました。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98