D

Dimple 7B

由rp-yu開發
Dimple是首個結合自迴歸與擴散訓練範式的離散擴散多模態大語言模型(DMLLM),在LLaVA-NEXT相同數據集上訓練後,以3.9%的優勢超越LLaVA-NEXT-7B。
下載量 422
發布時間 : 5/19/2025

模型概述

Dimple是一個多模態大語言模型,結合了自迴歸與擴散訓練範式,支持圖像文本到文本的任務。

模型特點

混合訓練
融合自迴歸與擴散訓練範式,增強模型性能。
擴散解碼
支持置信解碼、隨機解碼、maskgit式解碼及基於熵的解碼。
可控生成
通過結構先驗實現格式、結構與長度的細粒度控制。
類自迴歸預填充
採用預填充技術提升推理速度。

模型能力

圖像描述生成
多模態指令跟隨
文本生成
圖像分析

使用案例

多模態交互
圖像描述
生成對圖像的詳細描述。
生成自然且準確的圖像描述。
視覺問答
回答關於圖像內容的問題。
提供準確且上下文相關的答案。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase