J

Janus Pro 1B

由deepseek-ai開發
Janus-Pro 是一種新穎的自迴歸框架,統一了多模態理解與生成能力。通過解耦視覺編碼路徑,使用單一 Transformer 架構處理多模態任務。
下載量 34.02k
發布時間 : 1/26/2025

模型概述

Janus-Pro 是一個統一多模態理解和生成的模型,通過分離視覺編碼設計,解決了理解與生成角色間的衝突,具有高靈活性和高效性。

模型特點

解耦視覺編碼
將視覺編碼解耦為獨立路徑,緩解理解與生成角色間的衝突,增強模型靈活性。
統一架構
使用單一 Transformer 架構處理多模態任務,簡化模型設計。
高性能
超越之前的統一模型,達到或超過專用任務模型的性能。

模型能力

多模態理解
文本到圖像生成
視覺問答
圖像描述生成

使用案例

內容生成
圖像生成
根據文本描述生成高質量圖像。
支持 16 倍降採樣率,生成細節豐富的圖像。
視覺理解
圖像分析
理解圖像內容並回答相關問題。
支持 384 x 384 分辨率圖像輸入。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase