4

4M 21 B

由EPFL-VILAB開發
4M是一個通過標記化與掩碼技術實現多模態擴展的'任意到任意'基礎模型訓練框架
下載量 324
發布時間 : 6/12/2024

模型概述

4M框架訓練的多模態基礎模型能執行廣泛視覺任務,可遷移至未見過的任務與模態,並具備靈活可控的多模態生成能力。

模型特點

任意到任意多模態轉換
支持數十種模態間的相互轉換與處理
任務遷移能力
可遷移至未見過的任務與模態
可控生成
具備靈活可控的多模態生成能力
開源框架
提供完整的訓練框架和預訓練模型

模型能力

多模態數據處理
視覺任務處理
跨模態轉換
可控內容生成

使用案例

計算機視覺
圖像理解與生成
處理各種視覺理解任務並生成相關內容
多模態應用
跨模態轉換
在不同模態數據間進行轉換處理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase