H

Hunyuanvideogp HFIE

jbilcke-hfによって開発
混元ビデオは騰訊がオープンソースした大規模ビデオ生成モデルで、革新的な統一アーキテクチャを採用して高品質のテキストからビデオへの生成を実現します。
ダウンロード数 24
リリース時間 : 12/11/2024

モデル概要

混元ビデオは、主流のクローズドソースモデルに匹敵する性能を持つ新型オープンソースビデオ基礎モデルで、データ選別、画像 - ビデオの連合訓練などの重要な革新を統合し、高品質のビデオ生成をサポートします。

モデル特徴

統一された画像とビデオ生成アーキテクチャ
「ダブルフローからシングルフロー」の混合設計を採用し、視覚と意味情報の複雑な相互作用を効果的に捉えます。
マルチモーダル大規模言語モデルテキストエンコーダ
視覚指令で微調整されたマルチモーダル大規模言語モデルをテキストエンコーダとして使用し、より強力な詳細記述と複雑な推論能力を備えています。
3D変分自己符号化器
因果畳み込み3Dの変分自己符号化器を採用して、効率的なビデオ空間圧縮を実現します。
プロンプトの書き換え
標準モードとマスターモードの2種類のプロンプト書き換え方式を提供し、生成結果を最適化します。

モデル能力

テキストからビデオへの生成
高品質のビデオ合成
複雑なシーンの理解
多様なスタイルのビデオ生成

使用事例

クリエイティブコンテンツ制作
ショートビデオ制作
テキスト記述に基づいて自動的にクリエイティブなショートビデオを生成します。
5秒の高品質ビデオを生成できます。
映画制作支援
コンセプトビデオのプレビュー
映画のコンセプトプレビュービデオを迅速に生成します。
720pの高解像度ビデオ生成をサポートします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase