VQVAEオープンソース動画生成モデル - 無料でロード可能、動画コンテンツ作成を便利にサポート！

ホーム

Vqvae

hpcai-techによって開発

VQVAEはVQ-VAEアーキテクチャに基づく動画生成モデルで、VideoGPTプロジェクトからクローンされ、Hugging Face形式に変換してより簡単にロードできるように設計されています。

動画処理

Transformers

オープンソースライセンス:MIT #動画生成 #VQ-VAEアーキテクチャ #Transformer統合

ダウンロード数 179

リリース時間 : 2/20/2024

モデル概要

このモデルはVQ-VAE（ベクトル量子化変分オートエンコーダ）アーキテクチャに基づいており、動画データを離散的な潜在表現にエンコードすることで効率的な生成を実現します。

モデル特徴

効率的な動画表現

VQ-VAEアーキテクチャにより動画を離散的な潜在表現にエンコードし、効率的な保存と処理を実現します。

Hugging Face互換

モデルはHugging Face形式に変換されており、Hugging Faceエコシステムで簡単にロードして使用できます。

動画生成能力

潜在表現に基づいて高品質な動画コンテンツを生成できます。

モデル能力

動画エンコーディング

動画生成

潜在表現学習

使用事例

クリエイティブコンテンツ生成

ショート動画生成

クリエイティブなショート動画コンテンツを生成

一貫性のあるショート動画シーケンスを生成可能

データ拡張

動画データ拡張

動画認識タスクのための追加トレーニングデータを生成

限られた動画データセットを拡張可能

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Vqvae

モデル概要

モデル特徴

モデル能力

使用事例

🚀 VQVAE

🚀 クイックスタート

📄 ライセンス