Text_to_Vision開源文本轉視頻模型 - 免費使用，輸入文本即可生成視頻

首頁

Text To Vision

由Revanthraja開發

一個使用Hugging Face Transformers庫微調的文本轉視頻生成模型，能夠根據文本輸入生成視頻內容。

文本生成視頻開源協議:MIT #文本驅動視頻生成 #多領域適配 #Transformers微調

下載量 24

發布時間 : 12/10/2023

模型概述

該模型基於Hugging Face的Transformers架構，專門用於將文本描述轉化為相應的視頻序列。通過對多樣化數據集的微調訓練，能夠理解並可視化各種文本提示，生成相關的視頻內容。

模型特點

文本到視頻轉換

能夠將文本輸入轉換為對應的視頻序列，實現文本描述的可視化。

多領域數據集微調

使用Hugging Face Transformers在多領域數據集上進行微調，提高模型的泛化能力。

多樣化內容生成

能夠根據文本描述生成多樣化的視頻內容，處理具有細微差別的文本提示。

模型能力

文本到視頻生成

多領域內容理解

視頻序列生成

使用案例

內容創作

短視頻生成

根據文本描述自動生成短視頻內容

快速生成符合描述的短視頻片段

教育視頻製作

將教育內容文本轉換為可視化視頻

提高教育內容的吸引力和理解度

廣告營銷

廣告視頻生成

根據產品描述生成廣告視頻

快速製作多樣化廣告素材

屬性	詳情
模型類型	文本到視頻生成模型
訓練數據	多種數據集

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Text To Vision

模型概述

模型特點

模型能力

使用案例

🚀 文本到視頻模型與Hugging Face Transformers

🚀 快速開始

✨ 主要特性

📄 許可證