JanusFlow-1.3B開源模型 - 統一圖像理解與生成，實現強大圖像處理

首頁

Janusflow 1.3B

由deepseek-ai開發

JanusFlow是一個強大的框架，將圖像理解與生成統一在單一模型中，採用自迴歸語言模型與修正流相結合的方法。

文本生成圖像

Transformers

開源協議:MIT #多模態統一模型 #文本生成圖像 #修正流生成

下載量 1,538

發布時間 : 11/12/2024

模型概述

JanusFlow是一個統一的多模態大語言模型，支持圖像理解和生成任務，基於DeepSeek-LLM-1.3b-base構建，結合了SigLIP-L視覺編碼器和SDXL-VAE生成器。

模型特點

統一的多模態理解與生成

將圖像理解與生成統一在單一模型中，簡化了多模態任務的流程。

極簡架構

採用自迴歸語言模型與修正流相結合的方法，無需複雜的架構修改。

高分辨率支持

支持384×384分辨率的圖像輸入和生成。

模型能力

圖像理解

文本生成圖像

多模態任務處理

使用案例

圖像生成

文本到圖像生成

根據文本描述生成高質量的圖像。

生成384×384分辨率的圖像。

多模態理解

圖像理解

理解輸入的圖像內容並生成相關描述或回答。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Janusflow 1.3B

模型概述

模型特點

模型能力

使用案例

🚀 JanusFlow

🚀 快速開始

✨ 主要特性

📚 詳細文檔

📄 許可證

📚 引用

📞 聯繫我們