4

4M 7 SR L CC12M

Developed by EPFL-VILAB
4M是一個可擴展的多模態掩碼建模框架,支持任意到任意模態轉換,覆蓋數十種模態和任務。
Downloads 26
Release Time : 3/25/2024

Model Overview

4M是通過標記化與掩碼技術擴展到多種模態的'任意到任意'基礎模型訓練框架。基於4M訓練的模型能執行廣泛視覺任務,可遷移至未見過的任務與模態,並具備靈活可控的多模態生成能力。

Model Features

任意到任意模態轉換
支持多種模態間的靈活轉換,包括視覺、語言等數十種模態
可擴展性
框架設計允許輕鬆擴展到新的模態和任務
遷移學習能力
能夠遷移到未見過的任務和模態
可控生成
支持靈活可控的多模態內容生成

Model Capabilities

多模態轉換
視覺任務處理
可控內容生成
跨模態遷移學習

Use Cases

計算機視覺
圖像生成與編輯
基於不同模態輸入生成或編輯圖像
跨模態應用
文本到圖像生成
根據文本描述生成對應圖像
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase