J

Janus 1.3B

Developed by deepseek-ai
Janus 是一種新穎的自迴歸框架,統一了多模態理解與生成。它通過解耦視覺編碼,解決了先前方法的侷限性,增強了框架的靈活性。
Downloads 12.44k
Release Time : 10/18/2024

Model Overview

Janus 是一個統一理解與生成的多模態大語言模型(MLLM),它解耦了多模態理解與生成的視覺編碼。基於 DeepSeek-LLM-1.3b-base 構建,支持多模態理解和圖像生成。

Model Features

解耦視覺編碼
將視覺編碼解耦為獨立路徑,緩解了視覺編碼器在理解與生成角色之間的衝突。
統一架構
使用單一的統一 Transformer 架構處理多模態理解與生成任務。
靈活性
解耦設計增強了框架的靈活性,使其能夠適應多種任務。

Model Capabilities

多模態理解
文本生成圖像
圖像理解

Use Cases

多模態交互
圖像生成
根據文本描述生成圖像。
支持高質量圖像生成。
圖像理解
理解圖像內容並生成相關描述。
達到或超過特定任務模型的性能。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase