K

Kandinsky 2 1 Inpaint

kandinsky-communityによって開発
カンディンスキー2.1はDall-E 2と潜在拡散モデルのベストプラクティスに基づくテキスト生成画像モデルで、CLIPをテキストと画像エンコーダーとして採用し、視覚的表現力を向上させています。
ダウンロード数 2,268
リリース時間 : 5/24/2023

モデル概要

このモデルはCLIPマルチモーダル潜在空間の拡散画像事前技術を組み合わせ、テキスト誘導の画像生成と修復をサポートし、クリエイティブな画像合成タスクに適しています。

モデル特徴

マルチモーダル潜在空間マッピング
CLIPを通じてテキストと画像エンコーディングの潜在空間マッピングを確立し、視覚的表現力を強化
画像融合能力
テキスト誘導の画像操作とコンテンツ融合をサポート
高解像度トレーニング
≥768x768解像度の1.7億の高品質画像ペアでトレーニング

モデル能力

テキスト生成画像
画像修復
テキスト誘導の画像編集
画像補間

使用事例

クリエイティブデザイン
コンセプトアート生成
テキスト記述に基づいてクリエイティブなコンセプトアートを生成
例では猫に帽子を追加する画像修復効果を示しています
コンテンツ編集
画像要素置換
マスクとテキストプロンプトを使用して画像の一部を変更
変更領域を正確に制御し、背景の一貫性を維持できます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase