S

Sd Image Variations Diffusers

lambdalabsによって開発
Stable Diffusionをファインチューニングした画像バリエーション生成モデルで、入力画像をスタイルが似た新しい画像に変換できます
ダウンロード数 10.88k
リリース時間 : 9/9/2022

モデル概要

このモデルはテキストエンコーダを画像エンコーダに置き換えることで、CLIP画像埋め込みを受け取り、入力画像とスタイルが似たバリエーション画像を生成できます。DALLE-2の画像バリエーション機能に似ています。

モデル特徴

画像バリエーション生成
入力画像に基づいてスタイルが似たバリエーション画像を生成可能
改良されたトレーニング方法
2段階のトレーニングを実施、第1段階でCrossAttention層をファインチューニング、第2段階でunet全体をトレーニング
Diffusersネイティブサポート
V2バージョンではぼやけ問題を修正し、🤗 Diffusersライブラリをネイティブサポート
高品質出力
V1バージョンと比較し、V2はより長いトレーニング時間で、より良い画像品質と高いCLIP類似度スコアを提供

モデル能力

画像スタイル変換
画像バリエーション生成
クリエイティブ画像合成

使用事例

アート創作
アートスタイル拡張
1つのアート作品から複数のスタイルバリエーションを生成
原作とスタイルは一致するが内容が異なる新しい作品を生成可能
デザイン支援
デザインコンセプト拡張
初期デザインコンセプトから複数のバリエーションを生成
デザイナーが異なるデザイン案を迅速に探索するのに役立つ
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase