POV-Drivingオープンソースモデル - 無料で任意のシーンの一人称運転動画を生成

ホーム

POV Driving

Remade-AIによって開発

Wan2.1 14B T2Vモデルを基に訓練されたLoRAで、あらゆるシナリオでの一人称運転動画を生成可能

テキスト生成ビデオ英語オープンソースライセンス:Apache-2.0 #一人称運転動画生成 #LoRA低ランク適応 #多様なシナリオ運転シミュレーション

ダウンロード数 61

リリース時間 : 3/27/2025

モデル概要

このLoRAモデルは一人称運転視点の動画生成専用に設計されており、地獄、砂漠、都市の街路、月面などの特殊環境を含む多様なシーンレンダリングをサポートします。テキストプロンプトにより高い一貫性を持つ運転シーン動画を生成できます。

モデル特徴

マルチシーン一貫性

異なるオブジェクトやシーンタイプ間で視覚要素の一貫性を維持

柔軟なプロンプト制御

標準化されたプロンプトテンプレートによるシーン要素の精密制御

プラグアンドプレイ適応

LoRA形式で提供され、既存の拡散モデルワークフローに迅速統合可能

モデル能力

テキストから動画生成

一人称視点生成

ダイナミックシーンレンダリング

多環境適応（地獄/砂漠/宇宙など）

使用事例

映像プリビジュアライゼーション

災害シーンプリビジュ

ストーリーボード設計用の極限環境下運転シーン生成

example_videos/pov1.mp4（地獄シーン）

ゲーム開発

レーシングゲームシーン生成

様々なトラック環境の運転視点素材を迅速生成

example_videos/pov3.mp4（都市夜景）

🚀 Wan2.1 14B T2V用POV Driving LoRA

このLoRAは、Wan2.1 14B T2Vモデルをベースに学習されており、あなたが望むあらゆるシーンや風景のPOV運転ビデオを生成することができます！

🚀 クイックスタート

このLoRAを使って、あなただけのPOV運転ビデオを生成しましょう。以下の手順に従って、モデルファイルをダウンロードし、設定を行います。

✨ 主な機能

Wan2.1 14B T2Vベースモデルを使用して学習
様々なオブジェクトやシーンタイプで一貫した結果を得ることができる
簡単に適応できるシンプルなプロンプト例を提供

📦 インストール

📥 ダウンロードリンク

pov_driving_5_epochs.safetensors - LoRAモデルファイル
wan_txt2vid_lora_workflow.json - ComfyUI用のWan T2V with LoRAワークフロー

💻 使用例

基本的な使用法

以下は、このLoRAを使ってビデオを生成するためのプロンプト例です。

p0v_dr1v1n6, video shows a person driving a car through a burning hellscape. The driver is holding the steering wheel with both hands. Rivers of lava flow on both sides of the cracked road, and firestorms rage in the distance. The driver is looking straight ahead. The car has a digital dashboard and a touchscreen display flickering with demonic symbols.

高度な使用法

高度なシーンを生成するために、プロンプトに追加の情報を含めることができます。

p0v_dr1v1n6 through a sandstorm in the desert, visibility dropping as golden dust engulfs the horizon, digital dashboard displaying emergency alerts, the car struggling against the powerful winds.

📚 ドキュメント

推奨設定

属性	详情
LoRA強度	1.0
埋め込みガイダンススケール	6.0
フローシフト	5.0

トリガーワード

キートリガーフレーズは、<code style="background-color: #f0f0f0; padding: 3px 6px; border-radius: 4px;">p0v_dr1v1n6</code>です。

プロンプトテンプレート

プロンプトについては、例のプロンプトを参考にしてください。このようなプロンプトの方法が非常にうまく機能するようです。

ComfyUIワークフロー

このLoRAは、KijaiのWan Video Wrapperワークフローの修正版で動作します。主な修正点は、ベースモデルに接続されたWan LoRAノードを追加することです。

ワークフロースクリーンショット

修正版のワークフローについては、上記のダウンロードセクションを参照してください。

🔧 技術詳細

モデル情報

モデルの重みはSafetensors形式で利用可能です。詳細は上記のダウンロードセクションを参照してください。

学習詳細

属性	详情
ベースモデル	Wan2.1 14B T2V
学習データ	様々なPOV運転映像の204の短いクリップ（各クリップは個別にキャプション付き）から構成される17分間のビデオを使用して学習
エポック数	5