Allegro T2V 40x720P
Allegroはオープンソースの高品質なテキストから動画を生成するモデルで、2秒から6秒、15 FPSの詳細な動画を生成でき、複数の解像度をサポートしています。
ダウンロード数 21
リリース時間 : 12/17/2024
モデル概要
Allegroは先進的なテキストから動画を生成するモデルで、テキストプロンプトに基づいて高品質な動画コンテンツを生成できます。368x640や720x1280など複数の解像度をサポートし、フレーム補間技術により30 FPSまで向上可能です。
モデル特徴
オープンソース
完全なモデルウェイトとコードがコミュニティに公開されており、Apache 2.0ライセンスを採用しています。
多様なコンテンツ作成
人間や動物のクローズアップから様々な動的シーンまで、幅広いコンテンツを生成できます。
高品質な出力
2秒から6秒、15 FPS、解像度368x640と720x1280の詳細な動画を生成でき、フレーム補間で30 FPSまで向上可能です。
軽量で効率的
1.75億パラメータのVideoVAEと28億パラメータのVideoDiTモデルを含みます。複数の精度をサポートし、BF16モードでCPUオフロードを有効にすると、わずか9.3 GBのVRAMしか消費しません。
モデル能力
テキストから動画生成
高品質動画合成
多様なコンテンツ作成
動画フレーム補間サポート
使用事例
クリエイティブコンテンツ生成
広告動画生成
製品説明に基づいて高品質な広告動画を生成します。
2秒から6秒の広告動画を生成し、ソーシャルメディアプロモーションに利用可能です。
アニメーションショート作成
ストーリーラインに基づいてアニメーションショートを生成します。
豊富なディテールを持つアニメーションショートを生成し、クリエイティブプロジェクトに適しています。
教育
教育動画生成
教育内容に基づいて補助動画を生成します。
高品質な教育動画を生成し、学習体験を向上させます。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98