視頻處理

2025年最佳 190 款視頻處理工具

Timesformer Base Finetuned K400

TimeSformer是基於Kinetics-400數據集預訓練的視頻分類模型，採用時空注意力機制實現視頻理解。

Vivit B 16x2 Kinetics400

ViViT是對視覺變換器(ViT)的擴展，適用於視頻處理，特別適合視頻分類任務。

Animatediff Motion Lora Zoom In

動態LoRAs能夠為動畫添加特定類型的運動效果，如縮放、平移、傾斜和旋轉。

VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型，通過預測被掩碼視頻塊的像素值學習視頻內部表示。

一種新穎的視頻擴散模型，能夠根據任意數量的上下文幀生成高質量視頻

Videomae Base Finetuned Kinetics

VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型，在Kinetics-400數據集上微調後可用於視頻分類任務。

Mochi 1 Preview

由Genmo開發的高保真視頻生成模型，具有卓越的運動表現力和精準的提示跟隨能力

視頻處理英語

Animatediff Motion Lora Zoom Out

動態LoRAs能為動畫添加特定類型的運動效果

Ppo SpaceInvadersNoFrameskip V4

這是一個基於PPO算法的強化學習智能體，專門用於在SpaceInvadersNoFrameskip-v4遊戲環境中進行訓練和遊戲。

Stable Video Diffusion Img2vid Xt 1 1

Stable Video Diffusion (SVD) 1.1 是一款基於擴散模型的圖像轉視頻工具，能夠將靜態圖像作為條件幀生成短視頻片段。

Videomaev2 Large

VideoMAEv2-Large是基於UnlabeldHybrid-1M數據集進行自監督預訓練的大規模視頻特徵提取模型

Animatediff Motion Lora Pan Left

運動LoRAs能為您的動畫添加特定類型的運動效果

Animatediff Motion Lora Tilt Down

動態LoRAs模型，用於為文本轉視頻動畫添加特定類型的運動效果

Wan2.1 FLF2V 14B 720P Gguf

Wan2.1-FLF2V-14B-720P 是一個視頻生成模型，支持從圖像生成視頻，適用於多種視頻創作場景。

視頻處理支持多種語言

Animatediff Motion Lora Pan Right

動態LoRA模型能為動畫添加特定類型的運動效果，如推近/拉遠、平移、傾斜和旋轉。

Videomae Large Finetuned Kinetics

VideoMAE是基於掩碼自編碼器的自監督視頻預訓練模型，在Kinetics-400數據集上微調後可用於視頻分類任務。

Timesformer Base Finetuned K600

TimeSformer是基於Kinetics-600數據集預訓練的視頻分類模型，採用時空注意力機制處理視頻數據。

Videomaev2 Base

VideoMAEv2-Base是基於自監督學習的視頻特徵提取模型，採用雙重掩碼機制在UnlabeldHybrid-1M數據集上預訓練。

Moviigen1.1 GGUF

MoviiGen1.1 是一個基於 GGUF 格式轉換的視頻生成模型，支持文本生成視頻任務。

VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型，通過預測掩碼視頻塊的像素值學習視頻表徵

Videomae Huge Finetuned Kinetics

VideoMAE是基於掩碼自編碼器(MAE)的視頻預訓練模型，通過自監督學習在Kinetics-400數據集上微調，適用於視頻分類任務。

Timesformer Hr Finetuned K600

TimeSformer是一種基於空間-時間注意力機制的視頻分類模型，專門用於視頻理解任務。

LivePortrait是一個高效的人像動畫生成模型，通過縫合與重定向控制技術實現靜態圖像到動態視頻的轉換

Videomae Small Finetuned Kinetics

VideoMAE是視頻領域的掩碼自編碼器模型，通過自監督預訓練並在Kinetics-400數據集上進行監督微調，適用於視頻分類任務。

基於Wan2.1 14B I2V 480p模型訓練的LoRA，可將任意圖像中的對象轉化為蛋糕形態的特效視頻

視頻處理英語

Vivit B 16x2 Kinetics400 Finetuned Cctv Surveillance

基於ViViT架構的視頻動作識別模型，專為CCTV監控場景微調，在動作識別任務中表現優異。

基於Wan2.1 14B I2V 480p模型訓練的LoRA，可將靜態圖像轉化為充氣效果的動態視頻

視頻處理英語

Animatediff Motion Lora Rolling Clockwise

AnimateDiff 動態適配器模型，用於為生成的動畫添加特定運動效果

Animatediff Motion Lora V1 5 3

動態LoRAs能夠為動畫添加特定類型的運動效果，如放大/縮小、平移、傾斜和旋轉。

騰訊混元社區開發的圖像轉視頻模型，能夠將輸入的文本描述轉換為動態視頻內容。

視頻處理英語

Videomaev2 Huge

VideoMAEv2-Huge是一個基於自監督學習的視頻特徵提取模型，在UnlabeldHybrid-1M數據集上進行了1200輪預訓練。

Animatediff Motion Lora Rolling Anticlockwise

動態LoRAs模型，用於為文本生成的動畫添加特定類型的運動效果

Videomaev2 Giant

VideoMAEv2-giant是一個基於自監督學習的超大規模視頻分類模型，採用雙掩碼策略進行預訓練。

ViViT是對視覺變換器(ViT)的擴展，適用於視頻處理，主要用於視頻分類等下游任務。

Videomae Base Finetuned Ssv2

VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型，在Something-Something-v2數據集上微調用於視頻分類任務。

Skyreels V2 I2V 14B 540P GGUF

SkyReels-V2-I2V-14B-540P 是一個基於 GGUF 格式轉換的圖像轉視頻模型，支持從靜態圖像生成動態視頻內容。

Videomae Base Short

VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型，通過掩碼補丁預測學習視頻內部表示，適用於下游視頻分類等任務。

Animatediff Motion Adapter V1 5 3

AnimateDiff是一種能夠利用現有Stable Diffusion文生圖模型創建視頻的技術，通過插入運動模塊層實現圖像幀間的連貫運動。

Skyreels V2 I2V 14B 720P GGUF

SkyReels-V2-I2V-14B-720P 是一個圖像轉視頻生成模型，能夠將靜態圖像轉換為動態視頻。

基於Wan2.1 14B I2V 480p模型訓練的LoRA，可實現接吻互動的圖像轉視頻生成

視頻處理英語

Stable Video Diffusion Img2vid Xt 1 1

基於靜態圖像生成短視頻片段的潛在擴散模型，支持1024x576分辨率25幀視頻生成

Animatediff Motion Adapter V1 5

AnimateDiff是一種能夠利用現有Stable Diffusion文生圖模型生成視頻的技術，通過插入運動模塊層實現圖像幀間連貫運動。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase