4

4M 21 XL

EPFL-VILABによって開発
4Mは'任意から任意'のマルチモーダル基盤モデルを訓練するフレームワークで、トークン化とマスキング技術により様々な異なるモダリティに拡張可能です。
ダウンロード数 57
リリース時間 : 6/12/2024

モデル概要

4Mフレームワークで訓練された基盤モデルは、幅広い視覚タスクを実行でき、優れた転移能力を持ち、柔軟で制御可能なマルチモーダル生成モデルです。

モデル特徴

任意から任意へのマルチモーダル変換
数十の異なるモダリティ間の任意の変換をサポート
強力な転移能力
未見のタスクやモダリティにもうまく転移可能
柔軟で制御可能な生成
マルチモーダル生成モデルとして高い柔軟性と制御性を備えている

モデル能力

マルチモーダルマスキングモデリング
視覚タスク処理
マルチモーダル生成
クロスモーダル変換

使用事例

コンピュータビジョン
画像生成
テキストや深度マップなどの他のモダリティから画像を生成
マルチモーダル処理
クロスモーダル変換
異なる視覚と言語モダリティ間で変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase