Timesformer Base Finetuned K400
TimeSformer是基於Kinetics-400數據集預訓練的視頻分類模型,採用時空注意力機制實現視頻理解。
視頻處理
Transformers

T
facebook
108.61k
33
Vivit B 16x2 Kinetics400
MIT
ViViT是對視覺變換器(ViT)的擴展,適用於視頻處理,特別適合視頻分類任務。
視頻處理
Transformers

V
google
56.94k
32
Animatediff Motion Lora Zoom In
動態LoRAs能夠為動畫添加特定類型的運動效果,如縮放、平移、傾斜和旋轉。
視頻處理
A
guoyww
51.43k
8
Videomae Base
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,通過預測被掩碼視頻塊的像素值學習視頻內部表示。
視頻處理
Transformers

V
MCG-NJU
48.66k
45
Dfot
MIT
一種新穎的視頻擴散模型,能夠根據任意數量的上下文幀生成高質量視頻
視頻處理
D
kiwhansong
47.19k
6
Videomae Base Finetuned Kinetics
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,在Kinetics-400數據集上微調後可用於視頻分類任務。
視頻處理
Transformers

V
MCG-NJU
44.91k
34
Mochi 1 Preview
Apache-2.0
由Genmo開發的高保真視頻生成模型,具有卓越的運動表現力和精準的提示跟隨能力
視頻處理 英語
M
genmo
27.13k
1,216
Animatediff Motion Lora Zoom Out
動態LoRAs能為動畫添加特定類型的運動效果
視頻處理
A
guoyww
11.43k
5
Ppo SpaceInvadersNoFrameskip V4
這是一個基於PPO算法的強化學習智能體,專門用於在SpaceInvadersNoFrameskip-v4遊戲環境中進行訓練和遊戲。
視頻處理
P
sb3
8,999
0
Stable Video Diffusion Img2vid Xt 1 1
其他
Stable Video Diffusion (SVD) 1.1 是一款基於擴散模型的圖像轉視頻工具,能夠將靜態圖像作為條件幀生成短視頻片段。
視頻處理
S
vdo
8,560
28
Videomaev2 Large
VideoMAEv2-Large是基於UnlabeldHybrid-1M數據集進行自監督預訓練的大規模視頻特徵提取模型
視頻處理
V
OpenGVLab
5,581
1
Animatediff Motion Lora Pan Left
運動LoRAs能為您的動畫添加特定類型的運動效果
視頻處理
A
guoyww
5,209
2
Animatediff Motion Lora Tilt Down
動態LoRAs模型,用於為文本轉視頻動畫添加特定類型的運動效果
視頻處理
A
guoyww
5,091
4
Wan2.1 FLF2V 14B 720P Gguf
Apache-2.0
Wan2.1-FLF2V-14B-720P 是一個視頻生成模型,支持從圖像生成視頻,適用於多種視頻創作場景。
視頻處理 支持多種語言
W
city96
5,019
17
Animatediff Motion Lora Pan Right
動態LoRA模型能為動畫添加特定類型的運動效果,如推近/拉遠、平移、傾斜和旋轉。
視頻處理
A
guoyww
4,923
2
Videomae Large Finetuned Kinetics
VideoMAE是基於掩碼自編碼器的自監督視頻預訓練模型,在Kinetics-400數據集上微調後可用於視頻分類任務。
視頻處理
Transformers

V
MCG-NJU
4,657
12
Timesformer Base Finetuned K600
TimeSformer是基於Kinetics-600數據集預訓練的視頻分類模型,採用時空注意力機制處理視頻數據。
視頻處理
Transformers

T
facebook
4,026
12
Videomaev2 Base
VideoMAEv2-Base是基於自監督學習的視頻特徵提取模型,採用雙重掩碼機制在UnlabeldHybrid-1M數據集上預訓練。
視頻處理
V
OpenGVLab
3,565
5
Moviigen1.1 GGUF
Apache-2.0
MoviiGen1.1 是一個基於 GGUF 格式轉換的視頻生成模型,支持文本生成視頻任務。
視頻處理
M
wsbagnsv1
3,522
18
Videomae Large
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,通過預測掩碼視頻塊的像素值學習視頻表徵
視頻處理
Transformers

V
MCG-NJU
3,243
31
Videomae Huge Finetuned Kinetics
VideoMAE是基於掩碼自編碼器(MAE)的視頻預訓練模型,通過自監督學習在Kinetics-400數據集上微調,適用於視頻分類任務。
視頻處理
Transformers

V
MCG-NJU
2,984
4
Timesformer Hr Finetuned K600
TimeSformer是一種基於空間-時間注意力機制的視頻分類模型,專門用於視頻理解任務。
視頻處理
Transformers

T
facebook
2,927
6
Liveportrait
MIT
LivePortrait是一個高效的人像動畫生成模型,通過縫合與重定向控制技術實現靜態圖像到動態視頻的轉換
視頻處理
L
KwaiVGI
2,495
389
Videomae Small Finetuned Kinetics
VideoMAE是視頻領域的掩碼自編碼器模型,通過自監督預訓練並在Kinetics-400數據集上進行監督微調,適用於視頻分類任務。
視頻處理
Transformers

V
MCG-NJU
2,152
1
Cakeify
Apache-2.0
基於Wan2.1 14B I2V 480p模型訓練的LoRA,可將任意圖像中的對象轉化為蛋糕形態的特效視頻
視頻處理 英語
C
Remade-AI
1,955
16
Vivit B 16x2 Kinetics400 Finetuned Cctv Surveillance
MIT
基於ViViT架構的視頻動作識別模型,專為CCTV監控場景微調,在動作識別任務中表現優異。
視頻處理
Transformers

V
ratchy-oak
1,939
1
Inflate
Apache-2.0
基於Wan2.1 14B I2V 480p模型訓練的LoRA,可將靜態圖像轉化為充氣效果的動態視頻
視頻處理 英語
I
Remade-AI
1,903
11
Animatediff Motion Lora Rolling Clockwise
AnimateDiff 動態適配器模型,用於為生成的動畫添加特定運動效果
視頻處理
A
guoyww
1,548
1
Animatediff Motion Lora V1 5 3
動態LoRAs能夠為動畫添加特定類型的運動效果,如放大/縮小、平移、傾斜和旋轉。
視頻處理
A
guoyww
1,438
4
Hyvid I2v Gguf
其他
騰訊混元社區開發的圖像轉視頻模型,能夠將輸入的文本描述轉換為動態視頻內容。
視頻處理 英語
H
calcuis
1,212
6
Videomaev2 Huge
VideoMAEv2-Huge是一個基於自監督學習的視頻特徵提取模型,在UnlabeldHybrid-1M數據集上進行了1200輪預訓練。
視頻處理
Safetensors
V
OpenGVLab
1,145
1
Animatediff Motion Lora Rolling Anticlockwise
動態LoRAs模型,用於為文本生成的動畫添加特定類型的運動效果
視頻處理
A
guoyww
1,129
1
Videomaev2 Giant
VideoMAEv2-giant是一個基於自監督學習的超大規模視頻分類模型,採用雙掩碼策略進行預訓練。
視頻處理
Safetensors
V
OpenGVLab
1,071
4
Vivit B 16x2
MIT
ViViT是對視覺變換器(ViT)的擴展,適用於視頻處理,主要用於視頻分類等下游任務。
視頻處理
Transformers

V
google
989
11
Videomae Base Finetuned Ssv2
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,在Something-Something-v2數據集上微調用於視頻分類任務。
視頻處理
Transformers

V
MCG-NJU
951
6
Skyreels V2 I2V 14B 540P GGUF
其他
SkyReels-V2-I2V-14B-540P 是一個基於 GGUF 格式轉換的圖像轉視頻模型,支持從靜態圖像生成動態視頻內容。
視頻處理
S
wsbagnsv1
929
8
Videomae Base Short
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,通過掩碼補丁預測學習視頻內部表示,適用於下游視頻分類等任務。
視頻處理
Transformers

V
MCG-NJU
886
3
Animatediff Motion Adapter V1 5 3
AnimateDiff是一種能夠利用現有Stable Diffusion文生圖模型創建視頻的技術,通過插入運動模塊層實現圖像幀間的連貫運動。
視頻處理
A
guoyww
800
8
Skyreels V2 I2V 14B 720P GGUF
其他
SkyReels-V2-I2V-14B-720P 是一個圖像轉視頻生成模型,能夠將靜態圖像轉換為動態視頻。
視頻處理
S
wsbagnsv1
724
4
Kissing
Apache-2.0
基於Wan2.1 14B I2V 480p模型訓練的LoRA,可實現接吻互動的圖像轉視頻生成
視頻處理 英語
K
Remade-AI
686
7
Stable Video Diffusion Img2vid Xt 1 1
其他
基於靜態圖像生成短視頻片段的潛在擴散模型,支持1024x576分辨率25幀視頻生成
視頻處理
S
weights
682
6
Animatediff Motion Adapter V1 5
AnimateDiff是一種能夠利用現有Stable Diffusion文生圖模型生成視頻的技術,通過插入運動模塊層實現圖像幀間連貫運動。
視頻處理
A
guoyww
649
3
- 1
- 2
- 3
- 4
- 5