4

4M 21 XL

由EPFL-VILAB開發
4M是一個訓練'任意到任意'多模態基礎模型的框架,通過標記化和掩碼技術擴展到多種不同模態。
下載量 57
發布時間 : 6/12/2024

模型概述

4M框架訓練的基礎模型能夠執行廣泛的視覺任務,具有良好的遷移能力,並且是靈活可控的多模態生成模型。

模型特點

任意到任意多模態轉換
支持數十種不同模態之間的任意轉換
強大的遷移能力
能夠很好地遷移到未見過的任務和模態
靈活可控的生成
作為多模態生成模型具有高度靈活性和可控性

模型能力

多模態掩碼建模
視覺任務處理
多模態生成
跨模態轉換

使用案例

計算機視覺
圖像生成
從其他模態(如文本、深度圖等)生成圖像
多模態處理
跨模態轉換
在不同視覺和語言模態之間進行轉換
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase