4

4M 7 SR L CC12M

由EPFL-VILAB開發
4M是一個可擴展的多模態掩碼建模框架,支持任意到任意模態轉換,覆蓋數十種模態和任務。
下載量 26
發布時間 : 3/25/2024

模型概述

4M是通過標記化與掩碼技術擴展到多種模態的'任意到任意'基礎模型訓練框架。基於4M訓練的模型能執行廣泛視覺任務,可遷移至未見過的任務與模態,並具備靈活可控的多模態生成能力。

模型特點

任意到任意模態轉換
支持多種模態間的靈活轉換,包括視覺、語言等數十種模態
可擴展性
框架設計允許輕鬆擴展到新的模態和任務
遷移學習能力
能夠遷移到未見過的任務和模態
可控生成
支持靈活可控的多模態內容生成

模型能力

多模態轉換
視覺任務處理
可控內容生成
跨模態遷移學習

使用案例

計算機視覺
圖像生成與編輯
基於不同模態輸入生成或編輯圖像
跨模態應用
文本到圖像生成
根據文本描述生成對應圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase