Timesformer Base Finetuned K400
TimeSformer是基于Kinetics-400数据集预训练的视频分类模型,采用时空注意力机制实现视频理解。
视频处理
Transformers

T
facebook
108.61k
33
Vivit B 16x2 Kinetics400
MIT
ViViT是对视觉变换器(ViT)的扩展,适用于视频处理,特别适合视频分类任务。
视频处理
Transformers

V
google
56.94k
32
Animatediff Motion Lora Zoom In
动态LoRAs能够为动画添加特定类型的运动效果,如缩放、平移、倾斜和旋转。
视频处理
A
guoyww
51.43k
8
Videomae Base
VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型,通过预测被掩码视频块的像素值学习视频内部表示。
视频处理
Transformers

V
MCG-NJU
48.66k
45
Dfot
MIT
一种新颖的视频扩散模型,能够根据任意数量的上下文帧生成高质量视频
视频处理
D
kiwhansong
47.19k
6
Videomae Base Finetuned Kinetics
VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型,在Kinetics-400数据集上微调后可用于视频分类任务。
视频处理
Transformers

V
MCG-NJU
44.91k
34
Mochi 1 Preview
Apache-2.0
由Genmo开发的高保真视频生成模型,具有卓越的运动表现力和精准的提示跟随能力
视频处理 英语
M
genmo
27.13k
1,216
Animatediff Motion Lora Zoom Out
动态LoRAs能为动画添加特定类型的运动效果
视频处理
A
guoyww
11.43k
5
Ppo SpaceInvadersNoFrameskip V4
这是一个基于PPO算法的强化学习智能体,专门用于在SpaceInvadersNoFrameskip-v4游戏环境中进行训练和游戏。
视频处理
P
sb3
8,999
0
Stable Video Diffusion Img2vid Xt 1 1
其他
Stable Video Diffusion (SVD) 1.1 是一款基于扩散模型的图像转视频工具,能够将静态图像作为条件帧生成短视频片段。
视频处理
S
vdo
8,560
28
Videomaev2 Large
VideoMAEv2-Large是基于UnlabeldHybrid-1M数据集进行自监督预训练的大规模视频特征提取模型
视频处理
V
OpenGVLab
5,581
1
Animatediff Motion Lora Pan Left
运动LoRAs能为您的动画添加特定类型的运动效果
视频处理
A
guoyww
5,209
2
Animatediff Motion Lora Tilt Down
动态LoRAs模型,用于为文本转视频动画添加特定类型的运动效果
视频处理
A
guoyww
5,091
4
Wan2.1 FLF2V 14B 720P Gguf
Apache-2.0
Wan2.1-FLF2V-14B-720P 是一个视频生成模型,支持从图像生成视频,适用于多种视频创作场景。
视频处理 支持多种语言
W
city96
5,019
17
Animatediff Motion Lora Pan Right
动态LoRA模型能为动画添加特定类型的运动效果,如推近/拉远、平移、倾斜和旋转。
视频处理
A
guoyww
4,923
2
Videomae Large Finetuned Kinetics
VideoMAE是基于掩码自编码器的自监督视频预训练模型,在Kinetics-400数据集上微调后可用于视频分类任务。
视频处理
Transformers

V
MCG-NJU
4,657
12
Timesformer Base Finetuned K600
TimeSformer是基于Kinetics-600数据集预训练的视频分类模型,采用时空注意力机制处理视频数据。
视频处理
Transformers

T
facebook
4,026
12
Videomaev2 Base
VideoMAEv2-Base是基于自监督学习的视频特征提取模型,采用双重掩码机制在UnlabeldHybrid-1M数据集上预训练。
视频处理
V
OpenGVLab
3,565
5
Moviigen1.1 GGUF
Apache-2.0
MoviiGen1.1 是一个基于 GGUF 格式转换的视频生成模型,支持文本生成视频任务。
视频处理
M
wsbagnsv1
3,522
18
Videomae Large
VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型,通过预测掩码视频块的像素值学习视频表征
视频处理
Transformers

V
MCG-NJU
3,243
31
Videomae Huge Finetuned Kinetics
VideoMAE是基于掩码自编码器(MAE)的视频预训练模型,通过自监督学习在Kinetics-400数据集上微调,适用于视频分类任务。
视频处理
Transformers

V
MCG-NJU
2,984
4
Timesformer Hr Finetuned K600
TimeSformer是一种基于空间-时间注意力机制的视频分类模型,专门用于视频理解任务。
视频处理
Transformers

T
facebook
2,927
6
Liveportrait
MIT
LivePortrait是一个高效的人像动画生成模型,通过缝合与重定向控制技术实现静态图像到动态视频的转换
视频处理
L
KwaiVGI
2,495
389
Videomae Small Finetuned Kinetics
VideoMAE是视频领域的掩码自编码器模型,通过自监督预训练并在Kinetics-400数据集上进行监督微调,适用于视频分类任务。
视频处理
Transformers

V
MCG-NJU
2,152
1
Cakeify
Apache-2.0
基于Wan2.1 14B I2V 480p模型训练的LoRA,可将任意图像中的对象转化为蛋糕形态的特效视频
视频处理 英语
C
Remade-AI
1,955
16
Vivit B 16x2 Kinetics400 Finetuned Cctv Surveillance
MIT
基于ViViT架构的视频动作识别模型,专为CCTV监控场景微调,在动作识别任务中表现优异。
视频处理
Transformers

V
ratchy-oak
1,939
1
Inflate
Apache-2.0
基于Wan2.1 14B I2V 480p模型训练的LoRA,可将静态图像转化为充气效果的动态视频
视频处理 英语
I
Remade-AI
1,903
11
Animatediff Motion Lora Rolling Clockwise
AnimateDiff 动态适配器模型,用于为生成的动画添加特定运动效果
视频处理
A
guoyww
1,548
1
Animatediff Motion Lora V1 5 3
动态LoRAs能够为动画添加特定类型的运动效果,如放大/缩小、平移、倾斜和旋转。
视频处理
A
guoyww
1,438
4
Hyvid I2v Gguf
其他
腾讯混元社区开发的图像转视频模型,能够将输入的文本描述转换为动态视频内容。
视频处理 英语
H
calcuis
1,212
6
Videomaev2 Huge
VideoMAEv2-Huge是一个基于自监督学习的视频特征提取模型,在UnlabeldHybrid-1M数据集上进行了1200轮预训练。
视频处理
Safetensors
V
OpenGVLab
1,145
1
Animatediff Motion Lora Rolling Anticlockwise
动态LoRAs模型,用于为文本生成的动画添加特定类型的运动效果
视频处理
A
guoyww
1,129
1
Videomaev2 Giant
VideoMAEv2-giant是一个基于自监督学习的超大规模视频分类模型,采用双掩码策略进行预训练。
视频处理
Safetensors
V
OpenGVLab
1,071
4
Vivit B 16x2
MIT
ViViT是对视觉变换器(ViT)的扩展,适用于视频处理,主要用于视频分类等下游任务。
视频处理
Transformers

V
google
989
11
Videomae Base Finetuned Ssv2
VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型,在Something-Something-v2数据集上微调用于视频分类任务。
视频处理
Transformers

V
MCG-NJU
951
6
Skyreels V2 I2V 14B 540P GGUF
其他
SkyReels-V2-I2V-14B-540P 是一个基于 GGUF 格式转换的图像转视频模型,支持从静态图像生成动态视频内容。
视频处理
S
wsbagnsv1
929
8
Videomae Base Short
VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型,通过掩码补丁预测学习视频内部表示,适用于下游视频分类等任务。
视频处理
Transformers

V
MCG-NJU
886
3
Animatediff Motion Adapter V1 5 3
AnimateDiff是一种能够利用现有Stable Diffusion文生图模型创建视频的技术,通过插入运动模块层实现图像帧间的连贯运动。
视频处理
A
guoyww
800
8
Skyreels V2 I2V 14B 720P GGUF
其他
SkyReels-V2-I2V-14B-720P 是一个图像转视频生成模型,能够将静态图像转换为动态视频。
视频处理
S
wsbagnsv1
724
4
Kissing
Apache-2.0
基于Wan2.1 14B I2V 480p模型训练的LoRA,可实现接吻互动的图像转视频生成
视频处理 英语
K
Remade-AI
686
7
Stable Video Diffusion Img2vid Xt 1 1
其他
基于静态图像生成短视频片段的潜在扩散模型,支持1024x576分辨率25帧视频生成
视频处理
S
weights
682
6
Animatediff Motion Adapter V1 5
AnimateDiff是一种能够利用现有Stable Diffusion文生图模型生成视频的技术,通过插入运动模块层实现图像帧间连贯运动。
视频处理
A
guoyww
649
3
- 1
- 2
- 3
- 4
- 5