すべてのカテゴリ

動画処理

2025年最高の 190 個の動画処理ツール

Timesformer Base Finetuned K400

TimeSformerはKinetics-400データセットで事前学習されたビデオ分類モデルで、時空間アテンションメカニズムを用いてビデオ理解を実現します。

Vivit B 16x2 Kinetics400

ViViTはビジョントランスフォーマー(ViT)をビデオ処理向けに拡張したもので、特にビデオ分類タスクに適しています。

Animatediff Motion Lora Zoom In

動的LoRAsは、ズーム、パン、チルト、回転などの特定の種類のモーション効果をアニメーションに追加できます。

VideoMAEはマスクオートエンコーダ(MAE)に基づくビデオ自己教師あり事前学習モデルで、マスクされたビデオブロックのピクセル値を予測することでビデオ内部表現を学習します。

任意の数のコンテキストフレームから高品質なビデオを生成できる新しいビデオ拡散モデル

Videomae Base Finetuned Kinetics

VideoMAEはマスクオートエンコーダ(MAE)に基づく動画自己教師あり事前学習モデルで、Kinetics-400データセットでファインチューニング後、動画分類タスクに使用可能です。

Mochi 1 Preview

Genmoが開発した高品質ビデオ生成モデルで、優れた動き表現力と正確なプロンプト追従能力を備えています

動画処理英語

Animatediff Motion Lora Zoom Out

動的LoRAsはアニメーションに特定のタイプの動き効果を追加できます

Ppo SpaceInvadersNoFrameskip V4

これはPPOアルゴリズムに基づく強化学習エージェントで、SpaceInvadersNoFrameskip-v4ゲーム環境でのトレーニングとプレイに特化しています。

Stable Video Diffusion Img2vid Xt 1 1

Stable Video Diffusion (SVD) 1.1 は拡散モデルベースの画像から動画への変換ツールで、静止画像を条件フレームとして短い動画クリップを生成できます。

Videomaev2 Large

VideoMAEv2-LargeはUnlabeldHybrid-1Mデータセットを用いた自己教師あり事前学習による大規模ビデオ特徴抽出モデルです

Animatediff Motion Lora Pan Left

モーションLoRAsはアニメーションに特定の種類の動き効果を追加できます

Animatediff Motion Lora Tilt Down

動的LoRAsモデル、テキストからビデオアニメーションに特定の種類の動き効果を追加するために使用

Wan2.1 FLF2V 14B 720P Gguf

Wan2.1-FLF2V-14B-720P は画像から動画を生成するモデルで、様々な動画制作シーンに適しています。

動画処理複数言語対応

Animatediff Motion Lora Pan Right

動的LoRAモデルは、ズームイン/アウト、パン、チルト、回転などの特定のタイプの動き効果をアニメーションに追加できます。

Videomae Large Finetuned Kinetics

VideoMAEはマスク自己符号化器に基づく自己教師あり動画事前学習モデルで、Kinetics-400データセットでファインチューニング後、動画分類タスクに使用可能です。

Timesformer Base Finetuned K600

TimeSformerはKinetics-600データセットで事前学習されたビデオ分類モデルで、時空間注意メカニズムを使用してビデオデータを処理します。

Videomaev2 Base

VideoMAEv2-Baseは自己教師あり学習に基づく動画特徴抽出モデルで、UnlabeldHybrid-1Mデータセット上でデュアルマスキングメカニズムを用いて事前学習されています。

Moviigen1.1 GGUF

MoviiGen1.1 はGGUF形式に変換された動画生成モデルで、テキストから動画を生成するタスクをサポートします。

VideoMAEはマスクオートエンコーダ(MAE)に基づく動画自己教師あり事前学習モデルで、マスクされた動画ブロックのピクセル値を予測することで動画表現を学習します

Videomae Huge Finetuned Kinetics

VideoMAEはマスクオートエンコーダ(MAE)に基づくビデオ事前学習モデルで、自己教師あり学習によりKinetics-400データセットでファインチューニングされており、ビデオ分類タスクに適しています。

Timesformer Hr Finetuned K600

TimeSformerは、空間-時間注意メカニズムに基づくビデオ分類モデルで、ビデオ理解タスク専用に設計されています。

LivePortraitは効率的なポートレートアニメーション生成モデルで、縫合せとリダイレクト制御技術により静止画像から動画への変換を実現

Videomae Small Finetuned Kinetics

VideoMAEは動画分野のマスクオートエンコーダモデルで、自己教師あり事前学習を行いKinetics-400データセットで教師ありファインチューニングされており、動画分類タスクに適しています。

Wan2.1 14B I2V 480pモデルを基に訓練されたLoRAで、任意の画像内のオブジェクトをケーキ形態のエフェクト動画に変換可能

動画処理英語

Vivit B 16x2 Kinetics400 Finetuned Cctv Surveillance

ViViTアーキテクチャに基づくビデオ行動認識モデルで、CCTV監視シナリオ向けに微調整されており、行動認識タスクで優れた性能を発揮します。

Wan2.1 14B I2V 480pモデルを基に訓練されたLoRAで、静止画像を膨らむ効果の動画に変換

動画処理英語

Animatediff Motion Lora Rolling Clockwise

AnimateDiff 動的アダプターモデル、生成アニメーションに特定のモーション効果を追加

Animatediff Motion Lora V1 5 3

動的LoRAsは、ズームイン/アウト、パン、チルト、回転などの特定の種類の動き効果をアニメーションに追加できます。

テンセント混元コミュニティが開発した画像動画変換モデルで、入力されたテキスト記述を動画コンテンツに変換できます。

動画処理英語

Videomaev2 Huge

VideoMAEv2-Hugeは自己教師あり学習に基づくビデオ特徴抽出モデルで、UnlabeldHybrid-1Mデータセットで1200エポックの事前学習を行いました。

Animatediff Motion Lora Rolling Anticlockwise

動的LoRAsモデル、テキスト生成アニメーションに特定のモーション効果を追加

Videomaev2 Giant

VideoMAEv2-giantは自己教師あり学習に基づく超大規模ビデオ分類モデルで、デュアルマスキング戦略を用いて事前学習を行っています。

ViViTはビジョントランスフォーマー(ViT)をビデオ処理向けに拡張したもので、主にビデオ分類などの下流タスクに使用されます。

Videomae Base Finetuned Ssv2

VideoMAEはマスク自己符号化器(MAE)に基づく動画自己教師あり事前学習モデルで、Something-Something-v2データセットで動画分類タスク向けにファインチューニングされています。

Skyreels V2 I2V 14B 540P GGUF

SkyReels-V2-I2V-14B-540PはGGUF形式に変換された画像から動画への変換モデルで、静止画から動画コンテンツを生成できます。

Videomae Base Short

VideoMAEはマスク自己エンコーダー(MAE)に基づくビデオ自己教師あり事前学習モデルで、マスクパッチ予測を通じてビデオ内部表現を学習し、下流のビデオ分類などのタスクに適しています。

Animatediff Motion Adapter V1 5 3

AnimateDiffは既存のStable Diffusionテキストから画像生成モデルを利用して動画を作成する技術で、モーションモジュール層を挿入することで画像フレーム間の連続的な動きを実現します。

Skyreels V2 I2V 14B 720P GGUF

SkyReels-V2-I2V-14B-720P は、静止画像を動画に変換できる画像から動画生成モデルです。

Wan2.1 14B I2V 480pモデルをベースに訓練されたLoRAで、キスインタラクションの画像から動画生成が可能

動画処理英語

Stable Video Diffusion Img2vid Xt 1 1

静止画像からショート動画クリップを生成する潜在拡散モデルで、1024x576解像度の25フレーム動画生成をサポート

Animatediff Motion Adapter V1 5

AnimateDiffは、既存のStable Diffusionテキストから画像生成モデルを利用してビデオを生成できる技術で、モーションモジュール層を挿入することで画像フレーム間の連続的な動きを実現します。

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase