视频处理

2025年最佳的 190 个视频处理工具

Timesformer Base Finetuned K400

TimeSformer是基于Kinetics-400数据集预训练的视频分类模型，采用时空注意力机制实现视频理解。

Vivit B 16x2 Kinetics400

ViViT是对视觉变换器(ViT)的扩展，适用于视频处理，特别适合视频分类任务。

Animatediff Motion Lora Zoom In

动态LoRAs能够为动画添加特定类型的运动效果，如缩放、平移、倾斜和旋转。

VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型，通过预测被掩码视频块的像素值学习视频内部表示。

一种新颖的视频扩散模型，能够根据任意数量的上下文帧生成高质量视频

Videomae Base Finetuned Kinetics

VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型，在Kinetics-400数据集上微调后可用于视频分类任务。

Mochi 1 Preview

由Genmo开发的高保真视频生成模型，具有卓越的运动表现力和精准的提示跟随能力

视频处理英语

Animatediff Motion Lora Zoom Out

动态LoRAs能为动画添加特定类型的运动效果

Ppo SpaceInvadersNoFrameskip V4

这是一个基于PPO算法的强化学习智能体，专门用于在SpaceInvadersNoFrameskip-v4游戏环境中进行训练和游戏。

Stable Video Diffusion Img2vid Xt 1 1

Stable Video Diffusion (SVD) 1.1 是一款基于扩散模型的图像转视频工具，能够将静态图像作为条件帧生成短视频片段。

Videomaev2 Large

VideoMAEv2-Large是基于UnlabeldHybrid-1M数据集进行自监督预训练的大规模视频特征提取模型

Animatediff Motion Lora Pan Left

运动LoRAs能为您的动画添加特定类型的运动效果

Animatediff Motion Lora Tilt Down

动态LoRAs模型，用于为文本转视频动画添加特定类型的运动效果

Wan2.1 FLF2V 14B 720P Gguf

Wan2.1-FLF2V-14B-720P 是一个视频生成模型，支持从图像生成视频，适用于多种视频创作场景。

视频处理支持多种语言

Animatediff Motion Lora Pan Right

动态LoRA模型能为动画添加特定类型的运动效果，如推近/拉远、平移、倾斜和旋转。

Videomae Large Finetuned Kinetics

VideoMAE是基于掩码自编码器的自监督视频预训练模型，在Kinetics-400数据集上微调后可用于视频分类任务。

Timesformer Base Finetuned K600

TimeSformer是基于Kinetics-600数据集预训练的视频分类模型，采用时空注意力机制处理视频数据。

Videomaev2 Base

VideoMAEv2-Base是基于自监督学习的视频特征提取模型，采用双重掩码机制在UnlabeldHybrid-1M数据集上预训练。

Moviigen1.1 GGUF

MoviiGen1.1 是一个基于 GGUF 格式转换的视频生成模型，支持文本生成视频任务。

VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型，通过预测掩码视频块的像素值学习视频表征

Videomae Huge Finetuned Kinetics

VideoMAE是基于掩码自编码器(MAE)的视频预训练模型，通过自监督学习在Kinetics-400数据集上微调，适用于视频分类任务。

Timesformer Hr Finetuned K600

TimeSformer是一种基于空间-时间注意力机制的视频分类模型，专门用于视频理解任务。

LivePortrait是一个高效的人像动画生成模型，通过缝合与重定向控制技术实现静态图像到动态视频的转换

Videomae Small Finetuned Kinetics

VideoMAE是视频领域的掩码自编码器模型，通过自监督预训练并在Kinetics-400数据集上进行监督微调，适用于视频分类任务。

基于Wan2.1 14B I2V 480p模型训练的LoRA，可将任意图像中的对象转化为蛋糕形态的特效视频

视频处理英语

Vivit B 16x2 Kinetics400 Finetuned Cctv Surveillance

基于ViViT架构的视频动作识别模型，专为CCTV监控场景微调，在动作识别任务中表现优异。

基于Wan2.1 14B I2V 480p模型训练的LoRA，可将静态图像转化为充气效果的动态视频

视频处理英语

Animatediff Motion Lora Rolling Clockwise

AnimateDiff 动态适配器模型，用于为生成的动画添加特定运动效果

Animatediff Motion Lora V1 5 3

动态LoRAs能够为动画添加特定类型的运动效果，如放大/缩小、平移、倾斜和旋转。

腾讯混元社区开发的图像转视频模型，能够将输入的文本描述转换为动态视频内容。

视频处理英语

Videomaev2 Huge

VideoMAEv2-Huge是一个基于自监督学习的视频特征提取模型，在UnlabeldHybrid-1M数据集上进行了1200轮预训练。

Animatediff Motion Lora Rolling Anticlockwise

动态LoRAs模型，用于为文本生成的动画添加特定类型的运动效果

Videomaev2 Giant

VideoMAEv2-giant是一个基于自监督学习的超大规模视频分类模型，采用双掩码策略进行预训练。

ViViT是对视觉变换器(ViT)的扩展，适用于视频处理，主要用于视频分类等下游任务。

Videomae Base Finetuned Ssv2

VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型，在Something-Something-v2数据集上微调用于视频分类任务。

Skyreels V2 I2V 14B 540P GGUF

SkyReels-V2-I2V-14B-540P 是一个基于 GGUF 格式转换的图像转视频模型，支持从静态图像生成动态视频内容。

Videomae Base Short

VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型，通过掩码补丁预测学习视频内部表示，适用于下游视频分类等任务。

Animatediff Motion Adapter V1 5 3

AnimateDiff是一种能够利用现有Stable Diffusion文生图模型创建视频的技术，通过插入运动模块层实现图像帧间的连贯运动。

Skyreels V2 I2V 14B 720P GGUF

SkyReels-V2-I2V-14B-720P 是一个图像转视频生成模型，能够将静态图像转换为动态视频。

基于Wan2.1 14B I2V 480p模型训练的LoRA，可实现接吻互动的图像转视频生成

视频处理英语

Stable Video Diffusion Img2vid Xt 1 1

基于静态图像生成短视频片段的潜在扩散模型，支持1024x576分辨率25帧视频生成

Animatediff Motion Adapter V1 5

AnimateDiff是一种能够利用现有Stable Diffusion文生图模型生成视频的技术，通过插入运动模块层实现图像帧间连贯运动。

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase