World-Initializer-image-to-panorama開源全景生成模型 - 一鍵將單視角圖像轉為360°全景

首頁

World Initializer Image To Panorama

由TaiMingLu開發

基於FluxFillPipeline的全景生成模型，可將單視角圖像轉化為360°全景圖像

圖像生成 #單圖轉全景 #360°圖像生成 #視覺修復技術

下載量 175

發布時間 : 4/23/2025

模型概述

通過視覺條件修復技術將單視角圖像轉化為2048×1024等距柱狀投影的全景圖像，支持文本引導生成

模型特點

單圖轉全景

將任意尺寸的單視角圖像自動轉換為360°全景視圖

文本引導生成

支持通過文本提示引導全景圖像的生成過程

自動裁剪處理

自動將輸入圖像居中裁剪為正方形以適配處理流程

模型能力

圖像修復

全景生成

文本引導圖像生成

使用案例

虛擬場景構建

遊戲場景生成

從單張概念圖生成完整的360°遊戲環境

2048×1024分辨率等距柱狀投影全景圖

虛擬旅遊

將普通風景照片擴展為沉浸式全景視圖

可導航的全景環境

創意設計

概念藝術擴展

基於局部概念藝術創作完整的環境全景

風格一致的全景藝術作品

🚀 GenEx-World-Initializer 🧭🌍

GenEx World Initializer 是一個基於 FluxFillPipeline 構建的全景圖生成管道。它利用視覺條件修復技術，將單視圖圖像轉換為360°全景圖像。

🖼️ 輸入：一張圖像（任意尺寸，將被中心裁剪為正方形）
🧠 提示詞：用於引導全景圖生成的可選文本
🎯 輸出：2048 × 1024 的等距柱狀投影圖像
🧩 掩碼：使用固定的全景掩碼

🚀 快速開始

GenEx World Initializer 能夠高效地將單視圖圖像轉換為全景圖像，以下是使用該工具的基本步驟。

✨ 主要特性

強大的轉換能力：可以將單張圖像轉換為 360°全景圖像。
靈活的輸入：支持任意尺寸的圖像輸入。
可選提示引導：可以使用文本提示來引導全景圖的生成。

📦 安裝指南

運行該項目需要安裝以下依賴：

diffusers>=0.33.1
transformers
numpy
pillow
sentencepiece

💻 使用示例

基礎用法

from diffusers import DiffusionPipeline
from PIL import Image
import torch

pipe = DiffusionPipeline.from_pretrained(
    "genex-world/World-Initializer-image-to-panorama",
    custom_pipeline="genex_world_initializer_pipeline",  
    torch_dtype=torch.bfloat16,
    trust_remote_code=True
).to("cuda")

# Load your image (any resolution)
image = Image.open("example_input.jpg")

# Run inference
front_view, output = pipe(image=image)
output.images[0]

🏁 掩碼

以下掩碼用於訓練圖像修復擴散模型，並在推理時自動使用。

📚 詳細文檔

輸入：一張圖像，無論尺寸大小，系統會將其中心裁剪為正方形。
提示詞：可提供可選的文本提示，以引導全景圖的生成。
輸出：生成 2048 × 1024 的等距柱狀投影圖像。
掩碼：使用固定的全景掩碼進行處理。

🔧 技術細節

GenEx World Initializer 基於 FluxFillPipeline 構建，利用視覺條件修復技術實現單視圖圖像到 360°全景圖像的轉換。

📄 許可證

本項目採用 CC BY 4.0 許可證。

✨ BibTex

@misc{lu2025genexgeneratingexplorableworld,
      title={GenEx: Generating an Explorable World}, 
      author={Taiming Lu and Tianmin Shu and Junfei Xiao and Luoxin Ye and Jiahao Wang and Cheng Peng and Chen Wei and Daniel Khashabi and Rama Chellappa and Alan Yuille and Jieneng Chen},
      year={2025},
      eprint={2412.09624},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2412.09624}, 
}