K

Karlo V1 Alpha Image Variations

kakaobrainによって開発
KarloはOpenAI unCLIPアーキテクチャに基づくテキスト条件付き画像生成モデルで、効率的な超解像度能力を備えています
ダウンロード数 45
リリース時間 : 1/30/2023

モデル概要

KarloはunCLIPアーキテクチャに基づくテキストから画像を生成するモデルで、テキスト記述から高品質な画像を生成でき、画像バリエーション生成もサポートします。その超解像度モジュールは低解像度画像を256ピクセルに迅速にアップスケールできます。

モデル特徴

効率的な超解像度
64ピクセル画像を256ピクセルにアップグレードするのに7ステップの逆ステップのみで、VQ-GANスタイル損失ファインチューニングにより高周波ディテールを復元
改良されたアーキテクチャ
デコーダ内の学習可能なトランスフォーマーをViT-L/14テキストエンコーダに置き換え、モデル効率を向上
大規模トレーニング
1.15億の画像テキストペア(COYO-100M、CC3M、CC12Mを含む)でスクラッチからトレーニング

モデル能力

テキストから画像生成
画像超解像度向上
画像バリエーション生成

使用事例

クリエイティブデザイン
コンセプトアート生成
テキスト記述に基づいて迅速にクリエイティブなコンセプト画像を生成
例として生成された'緑の葉の上の大きな赤いカエルの高解像度写真'
画像強化
低解像度画像強化
低品質画像を256ピクセル解像度に迅速に向上
超解像度モジュールによる高周波ディテール復元
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase