Cat Text To Video 2.3b
C
Cat Text To Video 2.3b
motextureによって開発
条件強化型テキスト動画生成モデル。時系列条件変換器で生成シーンを拡張しスムーズな遷移を実現、プロンプト補間機能をサポート
ダウンロード数 25
リリース時間 : 1/22/2025
モデル概要
このモデルはModelScopeテキスト動画生成モデルの事前学習済み重みを使用し、時系列条件変換器で強化されています。生成シーンの拡張とシーン間のスムーズな遷移を実現します。同時にプロンプト補間機能をサポートし、シーン拡張中に場面切り替えが可能です。
モデル特徴
時系列条件変換器
時系列条件変換器による強化で、生成シーンを拡張しシーン間のスムーズな遷移を実現
プロンプト補間
シーン拡張中に場面を切り替え、異なるシーン間の自然な遷移を可能にする
高解像度生成
320x320解像度の動画生成をサポート
モデル能力
テキスト動画生成
動画シーン拡張
シーン切り替え遷移
使用事例
クリエイティブコンテンツ生成
アクションシーン遷移
自転車に乗るシーンからバイクに乗るシーンへスムーズに遷移
男性が自転車に乗る → 男性がバイクに乗る
人物動作変化
ハンバーガーを食べる人物からアイスクリームを食べる人物へ自然に遷移
ウィル・スミスがハンバーガーを食べる → ウィル・スミスがアイスクリームを食べる
アニメーション生成
アニメキャラ表情変化
静止状態から大笑いするアニメ少女のアニメーションを生成
ピンク髪の美しいアニメ少女 → 大笑いするアニメ少女
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98