mochi-lora开源模型 - 免费部署助力文本轻松生成精彩视频

首页

Mochi Lora

由 weathon 开发

基于Mochi-1预览模型进行LoRA微调的版本，专注于文本到视频生成任务

文本生成视频开源协议:Apache-2.0 #视频生成-LoRA微调 #动态场景模拟 #生物拟态渲染

下载量 112

发布时间 : 5/15/2025

模型简介

这是一个经过LoRA微调的Mochi-1预览模型，主要用于将文本描述转换为视频内容，特别擅长生成具有特定风格和主题的视频

模型特点

LoRA微调技术

使用LoRA(Low-Rank Adaptation)技术对基础模型进行高效微调，保留原始模型能力的同时适应特定任务

文本到视频生成

能够根据文本提示生成高质量的视频内容，如示例中的螃蟹融入岩石海床场景

风格适应性强

可以生成具有特定风格和色调的视频，如示例中的柔和棕灰色调

模型能力

文本到视频转换

风格化视频生成

场景细节渲染

使用案例

创意内容生成

自然场景模拟

生成逼真的自然场景视频，如海洋生物与环境融合

示例中生成的螃蟹融入岩石海床的视频

教育演示

生物伪装展示

生成展示动物伪装能力的教育视频

🚀 Mochi-1 预览版 LoRA 微调模型

本项目是基于 Mochi-1 预览版模型进行的 LoRA 微调，旨在利用先进的训练技术优化模型性能，为文本到视频的生成任务提供更高效、更优质的解决方案。

🚀 快速开始

使用该模型前，需要安装 ðŸ§¨ Diffusers 库。以下是基本的使用代码：

from diffusers import MochiPipeline
from diffusers.utils import export_to_video
import torch 

pipe = MochiPipeline.from_pretrained("genmo/mochi-1-preview")
pipe.load_lora_weights("CHANGE_ME")
pipe.enable_model_cpu_offload()

with torch.autocast("cuda", torch.bfloat16):
    video = pipe(
        prompt="CHANGE_ME",
        guidance_scale=6.0,
        num_inference_steps=64,
        height=480,
        width=848,
        max_sequence_length=256,
        output_type="np"
    ).frames[0]
export_to_video(video)

更多详细信息，包括 LoRA 的加权、合并和融合等操作，请查看 Diffusers 加载 LoRA 的文档。

✨ 主要特性

LoRA 微调：基于 Mochi-1 预览版模型进行 LoRA 微调，提升模型性能。
高效训练：使用 CogVideoX Factory 中的内存优化训练脚本，结合 TorchAO 和 DeepSpeed 进行训练。
文本到视频生成：支持文本到视频的生成任务。

📦 安装指南

使用该模型需要安装 ðŸ§¨ Diffusers 库，可通过以下命令进行安装：

pip install diffusers

💻 使用示例

基础用法

from diffusers import MochiPipeline
from diffusers.utils import export_to_video
import torch 

pipe = MochiPipeline.from_pretrained("genmo/mochi-1-preview")
pipe.load_lora_weights("CHANGE_ME")
pipe.enable_model_cpu_offload()

with torch.autocast("cuda", torch.bfloat16):
    video = pipe(
        prompt="CHANGE_ME",
        guidance_scale=6.0,
        num_inference_steps=64,
        height=480,
        width=848,
        max_sequence_length=256,
        output_type="np"
    ).frames[0]
export_to_video(video)

高级用法

目前文档未提供高级用法示例，你可以参考 Diffusers 加载 LoRA 的文档进行更多操作。

📚 详细文档

模型描述

这是对 Mochi-1 预览版模型 genmo/mochi-1-preview 的 LoRA 微调模型。该模型使用 CogVideoX Factory 进行训练，该仓库包含了使用 TorchAO 和 DeepSpeed 对 CogVideoX 和 Mochi 系列模型进行内存优化的训练脚本。脚本改编自 CogVideoX Diffusers 训练器。

下载模型

你可以在 Files & Versions 标签页中下载 LoRA。

预期用途与限制

如何使用

# TODO: add an example code snippet for running this diffusion pipeline

限制和偏差

[TODO: provide examples of latent issues and potential remediations]

训练细节

[TODO: describe the data used to train the model]

📄 许可证

该模型使用 Apache-2.0 许可证。

属性	详情
基础模型	genmo/mochi-1-preview
库名称	diffusers
许可证	apache-2.0
实例提示	有一只螃蟹融入了+布满岩石的海底+，螃蟹斑驳的棕色外壳、粗糙的质地和不规则的形状与散落的岩石和粗糙的沙子极为相似，一切都呈现出柔和的棕色和灰色调。螃蟹缓慢而微妙地移动着，很难被分辨出来，因为它粗糙的棕色图案看起来就像参差不齐、颜色相似的石头和沙块中的一块岩石。