R

Relismoilumi

Developed by aaronamortegui
拡散ベースのテキストから画像生成モデルで、テキストプロンプトによる高品質画像の生成と編集をサポート
Downloads 181
Release Time : 3/9/2023

Model Overview

Stable Diffusion v2-1は潜在拡散モデルをベースとしたテキストから画像生成システムで、OpenCLIP-ViT/Hをテキストエンコーダとして採用し、768x768解像度の画像生成をサポートしています。このバージョンはv2をベースに安全フィルタリング戦略で最適化されています。

Model Features

高解像度生成
最大768x768解像度の画像生成をサポートし、前世代モデルから大幅に向上
安全フィルタリング最適化
punsafeパラメータを使用した段階的トレーニングにより、生成品質とコンテンツ安全性のバランスを実現
OpenCLIPテキストエンコーディング
OpenCLIP-ViT/Hをテキストエンコーダとして使用し、優れたテキスト理解能力を提供
潜在空間効率
8倍ダウンサンプリングされた潜在表現空間で拡散を行うことで、計算リソース要件を大幅に削減

Model Capabilities

テキストから画像生成
画像編集
アート創作
デザイン支援

Use Cases

クリエイティブデザイン
コンセプトアート創作
ゲーム/映像業界向けにコンセプトアートを迅速に生成
様々なデザインスタイルを迅速に反復生成可能
グラフィックデザイン
広告、ポスターなどのデザイン素材を生成
高品質な基礎素材を提供
教育研究
生成モデル研究
生成モデルの限界とバイアスを研究
学術論文の実験に利用可能
教育デモンストレーション
AI生成アートの技術原理を展示
直感的で分かりやすい教育ツール
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase