4

4M 21 XL

Developed by EPFL-VILAB
4Mは'任意から任意'のマルチモーダル基盤モデルを訓練するフレームワークで、トークン化とマスキング技術により様々な異なるモダリティに拡張可能です。
Downloads 57
Release Time : 6/12/2024

Model Overview

4Mフレームワークで訓練された基盤モデルは、幅広い視覚タスクを実行でき、優れた転移能力を持ち、柔軟で制御可能なマルチモーダル生成モデルです。

Model Features

任意から任意へのマルチモーダル変換
数十の異なるモダリティ間の任意の変換をサポート
強力な転移能力
未見のタスクやモダリティにもうまく転移可能
柔軟で制御可能な生成
マルチモーダル生成モデルとして高い柔軟性と制御性を備えている

Model Capabilities

マルチモーダルマスキングモデリング
視覚タスク処理
マルチモーダル生成
クロスモーダル変換

Use Cases

コンピュータビジョン
画像生成
テキストや深度マップなどの他のモダリティから画像を生成
マルチモーダル処理
クロスモーダル変換
異なる視覚と言語モダリティ間で変換
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase