4

4M 7 B CC12M

由EPFL-VILAB開發
4M是一個訓練'任意到任意'多模態基礎模型的框架,通過標記化和掩碼技術擴展到多種不同模態。
下載量 209
發布時間 : 3/25/2024

模型概述

4M框架訓練的模型能夠執行廣泛的視覺任務,良好遷移到未見過的任務和模態,並且是靈活可控的多模態生成模型。

模型特點

任意到任意模態轉換
支持多種不同模態之間的相互轉換
大規模多模態支持
可擴展到數十種不同的模態和任務
良好的遷移能力
能夠良好遷移到未見過的任務和模態
靈活可控的生成
作為多模態生成模型具有高度靈活性和可控性

模型能力

多模態數據轉換
視覺任務處理
多模態生成
跨模態遷移學習

使用案例

計算機視覺
圖像生成
從其他模態數據生成圖像
視覺問答
結合視覺和語言模態回答問題
多模態應用
跨模態檢索
在不同模態數據之間進行檢索
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase