JanusFlow-1.3B開源模型 - 統一圖像理解與生成，實現強大圖像處理

Home

Janusflow 1.3B

Developed by deepseek-ai

JanusFlow是一個強大的框架，將圖像理解與生成統一在單一模型中，採用自迴歸語言模型與修正流相結合的方法。

文本生成圖像

Transformers

Open Source License:MIT #多模態統一模型 #文本生成圖像 #修正流生成

Downloads 1,538

Release Time : 11/12/2024

Model Overview

JanusFlow是一個統一的多模態大語言模型，支持圖像理解和生成任務，基於DeepSeek-LLM-1.3b-base構建，結合了SigLIP-L視覺編碼器和SDXL-VAE生成器。

Model Features

統一的多模態理解與生成

將圖像理解與生成統一在單一模型中，簡化了多模態任務的流程。

極簡架構

採用自迴歸語言模型與修正流相結合的方法，無需複雜的架構修改。

高分辨率支持

支持384×384分辨率的圖像輸入和生成。

Model Capabilities

圖像理解

文本生成圖像

多模態任務處理

Use Cases

圖像生成

文本到圖像生成

根據文本描述生成高質量的圖像。

生成384×384分辨率的圖像。

多模態理解

圖像理解

理解輸入的圖像內容並生成相關描述或回答。

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Janusflow 1.3B

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 JanusFlow

🚀 快速開始

✨ 主要特性

📚 詳細文檔

📄 許可證

📚 引用

📞 聯繫我們