P

Playground V2 512px Base

playgroundaiによって開発
Playground v2は拡散原理に基づくテキストから画像生成モデルで、Playground研究チームによってゼロから訓練され、主に研究目的で使用され、通常は高度に美学化された画像を生成することはできません。
ダウンロード数 70
リリース時間 : 11/30/2023

モデル概要

このモデルはテキストプロンプトに基づいて512x512解像度の画像を生成し、潜在拡散モデルであり、2つの固定された事前学習済みテキストエンコーダー(OpenCLIP - ViT/GとCLIP - ViT/L)を使用し、アーキテクチャはStable Diffusion XLと同じです。

モデル特徴

高品質画像生成
ユーザー調査によると、ユーザーはPlayground v2が生成する画像の方をStable Diffusion XLの2.5倍好むと回答しています。
研究に適している
異なる訓練段階の中間チェックポイントを公開し、評価指標も含めて、画像生成基礎モデルの研究を促進します。
新しい評価基準
MJHQ - 30K基準を導入し、高品質データセット上のFIDスコアによってモデルの美学的品質を自動評価します。

モデル能力

テキストから画像生成
512x512解像度の画像生成

使用事例

クリエイティブデザイン
コンセプトアート制作
テキスト記述に基づいてクリエイティブなコンセプトアート画像を生成します。
「ジャングルの中の宇宙飛行士」などの様々なクリエイティブ画像を生成できます。
研究応用
拡散モデル研究
画像生成技術の研究のための基礎モデルとして使用されます。
異なる訓練段階のチェックポイントと評価指標を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase