M

Mmada 8B MixCoT

由Gen-Verse開發
MMaDA是一類新型的多模態擴散基礎模型,在文本推理、多模態理解和文本到圖像生成等多個領域表現卓越。
下載量 601
發布時間 : 6/1/2025

模型概述

MMaDA採用統一的擴散架構,結合混合長思維鏈微調策略和統一的強化學習算法,旨在提升多模態任務的性能。

模型特點

統一擴散架構
採用共享的概率公式和與模態無關的設計,無需特定於模態的組件。
混合長思維鏈微調策略
在各模態間精心策劃統一的思維鏈格式,提升指令遵循能力和思維鏈生成性能。
統一的強化學習算法
採用UniGRPO算法,統一推理和生成任務的後訓練過程,確保性能持續提升。

模型能力

文本推理
多模態理解
文本到圖像生成

使用案例

文本處理
複雜文本推理
處理需要多步推理的複雜文本任務
更穩定的思維鏈生成性能
多模態任務
跨模態理解
同時處理和理解文本和圖像信息
更好的多模態理解能力
內容生成
文本到圖像生成
根據文本描述生成高質量圖像
高質量的圖像生成效果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase