Skyreels V1 Hunyuan T2V
天工巻物V1は、人物を中心とした初のオープンソース高級ビデオ基礎モデルで、混元ビデオフレームワークを基盤とし、数千万の高品質な映画クリップで微調整され、顔の動的キャプチャや映画級のライティング美学などの核心的な強みを備えています。
ダウンロード数 1,899
リリース時間 : 2/13/2025
モデル概要
人物中心のテキストtoビデオモデルで、高品質なビデオ生成をサポートし、特に人物の表情や動作の自然な表現に優れています。
モデル特徴
オープンソース先進性
オープンソース分野で最先端のレベルに達し、Klingや海螺などの商用モデルに匹敵する性能
顔の動的キャプチャ
33種類の微表情を正確に認識し、400種類以上の自然な動作組み合わせをサポート、人間の感情表現をリアルに再現
映画級ライティング美学
ハリウッド級の映画データでトレーニングされ、各フレームの構図、俳優の動き、カメラアングルが映画の質感を表現
多段階トレーニングプロセス
ドメイン転移事前トレーニング、画像toビデオモデル事前トレーニング、高品質微調整の3段階トレーニング手法を採用
モデル能力
テキストtoビデオ生成
人物表情生成
自然な動作生成
映画級映像生成
使用事例
映画制作
ショートビデオ制作
テキスト記述に基づき高品質なショートビデオを生成
映画の質感を持つショートビデオクリップを生成
人物アニメーション
豊かな表情と自然な動作を持つ人物アニメーションを生成
人間の感情表現をリアルに再現
広告クリエイティブ
広告ビデオ生成
製品説明に基づき広告ビデオを生成
プロフェッショナルなレベルの広告コンテンツを生成
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98