C

Coreml Stable Diffusion 2 1 Base

pcuenqによって開発
潜在拡散モデルに基づくテキストから画像を生成するシステムで、高解像度画像の合成と編集をサポート
ダウンロード数 164
リリース時間 : 12/23/2022

モデル概要

このモデルはテキストプロンプトに基づいて画像を生成・編集でき、テキストエンコーダーとしてOpenCLIP-ViT/Hを使用し、LAION-5Bデータセットのサブセットでトレーニングされています

モデル特徴

Appleハードウェア最適化
Core ML形式の重みを提供し、Appleシリコンチップ向けに最適化されており、Swift/Python推論をサポート
安全フィルタリング
トレーニングデータはNSFWフィルター処理済み(p_unsafe=0.1閾値)、2段階のファインチューニング戦略を採用
高解像度生成
768x768解像度の画像生成をサポート、v-目的関数に基づき最適化

モデル能力

テキストから画像生成
画像編集
アート創作
スタイル転送

使用事例

アート創作
コンセプトデザイン
テキスト記述に基づいてアートコンセプト画像を生成
クリエイティブなアイデアを迅速に可視化
デジタルアート
様々なスタイルのデジタルアート作品を生成
多様なアートスタイル出力をサポート
教育研究
生成モデル研究
拡散モデルの限界とバイアスを探究
学術論文の実験に使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase