Janus 1.3B
Janus 是一種新穎的自迴歸框架,統一了多模態理解與生成。它通過解耦視覺編碼,解決了先前方法的侷限性,增強了框架的靈活性。
Downloads 12.44k
Release Time : 10/18/2024
Model Overview
Janus 是一個統一理解與生成的多模態大語言模型(MLLM),它解耦了多模態理解與生成的視覺編碼。基於 DeepSeek-LLM-1.3b-base 構建,支持多模態理解和圖像生成。
Model Features
解耦視覺編碼
將視覺編碼解耦為獨立路徑,緩解了視覺編碼器在理解與生成角色之間的衝突。
統一架構
使用單一的統一 Transformer 架構處理多模態理解與生成任務。
靈活性
解耦設計增強了框架的靈活性,使其能夠適應多種任務。
Model Capabilities
多模態理解
文本生成圖像
圖像理解
Use Cases
多模態交互
圖像生成
根據文本描述生成圖像。
支持高質量圖像生成。
圖像理解
理解圖像內容並生成相關描述。
達到或超過特定任務模型的性能。
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98