Timesformer Base Finetuned K400
TimeSformerはKinetics-400データセットで事前学習されたビデオ分類モデルで、時空間アテンションメカニズムを用いてビデオ理解を実現します。
動画処理
Transformers

T
facebook
108.61k
33
Vivit B 16x2 Kinetics400
MIT
ViViTはビジョントランスフォーマー(ViT)をビデオ処理向けに拡張したもので、特にビデオ分類タスクに適しています。
動画処理
Transformers

V
google
56.94k
32
Animatediff Motion Lora Zoom In
動的LoRAsは、ズーム、パン、チルト、回転などの特定の種類のモーション効果をアニメーションに追加できます。
動画処理
A
guoyww
51.43k
8
Videomae Base
VideoMAEはマスクオートエンコーダ(MAE)に基づくビデオ自己教師あり事前学習モデルで、マスクされたビデオブロックのピクセル値を予測することでビデオ内部表現を学習します。
動画処理
Transformers

V
MCG-NJU
48.66k
45
Dfot
MIT
任意の数のコンテキストフレームから高品質なビデオを生成できる新しいビデオ拡散モデル
動画処理
D
kiwhansong
47.19k
6
Videomae Base Finetuned Kinetics
VideoMAEはマスクオートエンコーダ(MAE)に基づく動画自己教師あり事前学習モデルで、Kinetics-400データセットでファインチューニング後、動画分類タスクに使用可能です。
動画処理
Transformers

V
MCG-NJU
44.91k
34
Mochi 1 Preview
Apache-2.0
Genmoが開発した高品質ビデオ生成モデルで、優れた動き表現力と正確なプロンプト追従能力を備えています
動画処理 英語
M
genmo
27.13k
1,216
Animatediff Motion Lora Zoom Out
動的LoRAsはアニメーションに特定のタイプの動き効果を追加できます
動画処理
A
guoyww
11.43k
5
Ppo SpaceInvadersNoFrameskip V4
これはPPOアルゴリズムに基づく強化学習エージェントで、SpaceInvadersNoFrameskip-v4ゲーム環境でのトレーニングとプレイに特化しています。
動画処理
P
sb3
8,999
0
Stable Video Diffusion Img2vid Xt 1 1
その他
Stable Video Diffusion (SVD) 1.1 は拡散モデルベースの画像から動画への変換ツールで、静止画像を条件フレームとして短い動画クリップを生成できます。
動画処理
S
vdo
8,560
28
Videomaev2 Large
VideoMAEv2-LargeはUnlabeldHybrid-1Mデータセットを用いた自己教師あり事前学習による大規模ビデオ特徴抽出モデルです
動画処理
V
OpenGVLab
5,581
1
Animatediff Motion Lora Pan Left
モーションLoRAsはアニメーションに特定の種類の動き効果を追加できます
動画処理
A
guoyww
5,209
2
Animatediff Motion Lora Tilt Down
動的LoRAsモデル、テキストからビデオアニメーションに特定の種類の動き効果を追加するために使用
動画処理
A
guoyww
5,091
4
Wan2.1 FLF2V 14B 720P Gguf
Apache-2.0
Wan2.1-FLF2V-14B-720P は画像から動画を生成するモデルで、様々な動画制作シーンに適しています。
動画処理 複数言語対応
W
city96
5,019
17
Animatediff Motion Lora Pan Right
動的LoRAモデルは、ズームイン/アウト、パン、チルト、回転などの特定のタイプの動き効果をアニメーションに追加できます。
動画処理
A
guoyww
4,923
2
Videomae Large Finetuned Kinetics
VideoMAEはマスク自己符号化器に基づく自己教師あり動画事前学習モデルで、Kinetics-400データセットでファインチューニング後、動画分類タスクに使用可能です。
動画処理
Transformers

V
MCG-NJU
4,657
12
Timesformer Base Finetuned K600
TimeSformerはKinetics-600データセットで事前学習されたビデオ分類モデルで、時空間注意メカニズムを使用してビデオデータを処理します。
動画処理
Transformers

T
facebook
4,026
12
Videomaev2 Base
VideoMAEv2-Baseは自己教師あり学習に基づく動画特徴抽出モデルで、UnlabeldHybrid-1Mデータセット上でデュアルマスキングメカニズムを用いて事前学習されています。
動画処理
V
OpenGVLab
3,565
5
Moviigen1.1 GGUF
Apache-2.0
MoviiGen1.1 はGGUF形式に変換された動画生成モデルで、テキストから動画を生成するタスクをサポートします。
動画処理
M
wsbagnsv1
3,522
18
Videomae Large
VideoMAEはマスクオートエンコーダ(MAE)に基づく動画自己教師あり事前学習モデルで、マスクされた動画ブロックのピクセル値を予測することで動画表現を学習します
動画処理
Transformers

V
MCG-NJU
3,243
31
Videomae Huge Finetuned Kinetics
VideoMAEはマスクオートエンコーダ(MAE)に基づくビデオ事前学習モデルで、自己教師あり学習によりKinetics-400データセットでファインチューニングされており、ビデオ分類タスクに適しています。
動画処理
Transformers

V
MCG-NJU
2,984
4
Timesformer Hr Finetuned K600
TimeSformerは、空間-時間注意メカニズムに基づくビデオ分類モデルで、ビデオ理解タスク専用に設計されています。
動画処理
Transformers

T
facebook
2,927
6
Liveportrait
MIT
LivePortraitは効率的なポートレートアニメーション生成モデルで、縫合せとリダイレクト制御技術により静止画像から動画への変換を実現
動画処理
L
KwaiVGI
2,495
389
Videomae Small Finetuned Kinetics
VideoMAEは動画分野のマスクオートエンコーダモデルで、自己教師あり事前学習を行いKinetics-400データセットで教師ありファインチューニングされており、動画分類タスクに適しています。
動画処理
Transformers

V
MCG-NJU
2,152
1
Cakeify
Apache-2.0
Wan2.1 14B I2V 480pモデルを基に訓練されたLoRAで、任意の画像内のオブジェクトをケーキ形態のエフェクト動画に変換可能
動画処理 英語
C
Remade-AI
1,955
16
Vivit B 16x2 Kinetics400 Finetuned Cctv Surveillance
MIT
ViViTアーキテクチャに基づくビデオ行動認識モデルで、CCTV監視シナリオ向けに微調整されており、行動認識タスクで優れた性能を発揮します。
動画処理
Transformers

V
ratchy-oak
1,939
1
Inflate
Apache-2.0
Wan2.1 14B I2V 480pモデルを基に訓練されたLoRAで、静止画像を膨らむ効果の動画に変換
動画処理 英語
I
Remade-AI
1,903
11
Animatediff Motion Lora Rolling Clockwise
AnimateDiff 動的アダプターモデル、生成アニメーションに特定のモーション効果を追加
動画処理
A
guoyww
1,548
1
Animatediff Motion Lora V1 5 3
動的LoRAsは、ズームイン/アウト、パン、チルト、回転などの特定の種類の動き効果をアニメーションに追加できます。
動画処理
A
guoyww
1,438
4
Hyvid I2v Gguf
その他
テンセント混元コミュニティが開発した画像動画変換モデルで、入力されたテキスト記述を動画コンテンツに変換できます。
動画処理 英語
H
calcuis
1,212
6
Videomaev2 Huge
VideoMAEv2-Hugeは自己教師あり学習に基づくビデオ特徴抽出モデルで、UnlabeldHybrid-1Mデータセットで1200エポックの事前学習を行いました。
動画処理
Safetensors
V
OpenGVLab
1,145
1
Animatediff Motion Lora Rolling Anticlockwise
動的LoRAsモデル、テキスト生成アニメーションに特定のモーション効果を追加
動画処理
A
guoyww
1,129
1
Videomaev2 Giant
VideoMAEv2-giantは自己教師あり学習に基づく超大規模ビデオ分類モデルで、デュアルマスキング戦略を用いて事前学習を行っています。
動画処理
Safetensors
V
OpenGVLab
1,071
4
Vivit B 16x2
MIT
ViViTはビジョントランスフォーマー(ViT)をビデオ処理向けに拡張したもので、主にビデオ分類などの下流タスクに使用されます。
動画処理
Transformers

V
google
989
11
Videomae Base Finetuned Ssv2
VideoMAEはマスク自己符号化器(MAE)に基づく動画自己教師あり事前学習モデルで、Something-Something-v2データセットで動画分類タスク向けにファインチューニングされています。
動画処理
Transformers

V
MCG-NJU
951
6
Skyreels V2 I2V 14B 540P GGUF
その他
SkyReels-V2-I2V-14B-540PはGGUF形式に変換された画像から動画への変換モデルで、静止画から動画コンテンツを生成できます。
動画処理
S
wsbagnsv1
929
8
Videomae Base Short
VideoMAEはマスク自己エンコーダー(MAE)に基づくビデオ自己教師あり事前学習モデルで、マスクパッチ予測を通じてビデオ内部表現を学習し、下流のビデオ分類などのタスクに適しています。
動画処理
Transformers

V
MCG-NJU
886
3
Animatediff Motion Adapter V1 5 3
AnimateDiffは既存のStable Diffusionテキストから画像生成モデルを利用して動画を作成する技術で、モーションモジュール層を挿入することで画像フレーム間の連続的な動きを実現します。
動画処理
A
guoyww
800
8
Skyreels V2 I2V 14B 720P GGUF
その他
SkyReels-V2-I2V-14B-720P は、静止画像を動画に変換できる画像から動画生成モデルです。
動画処理
S
wsbagnsv1
724
4
Kissing
Apache-2.0
Wan2.1 14B I2V 480pモデルをベースに訓練されたLoRAで、キスインタラクションの画像から動画生成が可能
動画処理 英語
K
Remade-AI
686
7
Stable Video Diffusion Img2vid Xt 1 1
その他
静止画像からショート動画クリップを生成する潜在拡散モデルで、1024x576解像度の25フレーム動画生成をサポート
動画処理
S
weights
682
6
Animatediff Motion Adapter V1 5
AnimateDiffは、既存のStable Diffusionテキストから画像生成モデルを利用してビデオを生成できる技術で、モーションモジュール層を挿入することで画像フレーム間の連続的な動きを実現します。
動画処理
A
guoyww
649
3
- 1
- 2
- 3
- 4
- 5