K

Kandinsky 2 2 Decoder Inpaint

kandinsky-communityによって開発
Kandinsky 2.2はテキストから画像を生成する拡散モデルで、Dall-E 2と潜在拡散モデルのベストプラクティスを組み合わせ、新しいアイデアを導入しています。
ダウンロード数 28.23k
リリース時間 : 6/16/2023

モデル概要

Kandinsky 2.2はCLIPモデルをテキストおよび画像エンコーダーとして採用し、CLIPモダリティの潜在空間間で拡散画像事前分布を確立することで視覚表現力を向上させ、画像融合やテキスト誘導の画像処理をサポートします。

モデル特徴

CLIPモダリティ潜在空間マッピング
CLIPモデルを利用してテキストと画像エンコーダー間に拡散画像事前分布を確立し、視覚表現力を強化
画像融合能力
画像融合とテキスト誘導の画像処理をサポート
局所修復生成
テキスト誘導の局所画像修復機能をサポート

モデル能力

テキストから画像生成
画像局所修復
画像融合

使用事例

クリエイティブデザイン
画像局所編集
既存画像に特定要素を追加または修正(例:猫の画像に帽子を追加)
自然に融合した新しい画像を生成
コンテンツ制作
テキストから画像生成
テキスト記述に基づき高品質画像を生成
記述に合致する視覚コンテンツを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase