4

4M 21 L

由EPFL-VILAB開發
4M是一個通過標記化與掩碼技術擴展至多種模態的'任意到任意'基礎模型訓練框架
下載量 49
發布時間 : 6/12/2024

模型概述

基於4M訓練的模型能執行廣泛視覺任務,可遷移至未見過的任務與模態,並具備靈活可控的多模態生成能力

模型特點

任意到任意多模態處理
支持數十種模態和任務的靈活處理能力
可擴展性
框架設計支持擴展到新的模態和任務
遷移學習能力
可遷移至未見過的任務與模態
可控多模態生成
具備靈活可控的多模態生成能力

模型能力

多模態掩碼建模
視覺任務處理
跨模態遷移學習
可控內容生成

使用案例

計算機視覺
多模態視覺理解
處理和理解多種視覺模態數據
生成式AI
可控內容生成
根據輸入條件生成多模態內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase