U

Uniworld V1

LanguageBindによって開発
UniWorldは、ビジュアル理解、生成、編集のための統一フレームワークで、20以上のビジュアルタスクで優れた性能を発揮します。
ダウンロード数 253
リリース時間 : 5/21/2025

モデル概要

UniWorldは、ビジュアル理解、生成、編集タスクをサポートする統一的なビジュアルフレームワークです。高解像度セマンティックエンコーダを採用し、様々なビジュアルタスクで優れた性能を発揮し、すべてのリソースが完全にオープンソースです。

モデル特徴

完全オープンソース
モデル、データ、トレーニングと評価コードがすべてオープンソースで、コミュニティが統一アーキテクチャを探索しやすくなります。
高解像度セマンティックエンコーディング
対比ビジュアルエンコーダを参照制御信号として使用し、細かい詳細を保持します。
マルチタスク統一フレームワーク
エッジ検出、深度推定、画像分割など20種類以上のビジュアルタスクをサポートします。
高品質データセット
286Kの長い説明サンプルと724Kの高品質編集サンプルを含み、画像の短辺が1024ピクセル以上です。

モデル能力

テキストから画像生成
画像編集
画像理解
エッジ検出
深度推定
スケッチ描画
線分検出
画像分割
製品抽出
バーチャル試着

使用事例

画像生成
テキストから画像生成
テキスト記述に基づいて高品質な画像を生成します。
GenEval、WISEなどのベンチマークテストで優れた性能を発揮します。
画像編集
指令による編集
自然言語指令に基づいて画像を編集します。
ImgEdit - BenchでBAGELとStep1X - Editを上回ります。
スタイル転送
画像を特定のアートスタイルに変換します。
複数のスタイル変換をサポートします。
ビジュアル理解
エッジ検出
画像からエッジ情報を抽出します。
高精度なエッジ抽出
深度推定
画像の深度情報を推定します。
正確な深度マップ生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase