B

BAGEL 7B MoT

由ByteDance-Seed開發
BAGEL是一個開源的、擁有70億活躍參數的多模態基礎模型,訓練於大規模交錯多模態數據,在理解和生成任務上表現優異。
下載量 4,736
發布時間 : 5/19/2025

模型概述

BAGEL是一個統一的多模態基礎模型,能夠同時處理視覺理解和生成任務,在標準多模態理解排行榜上超越當前頂級開源視覺語言模型,並在文本到圖像生成質量上與專業生成器相媲美。

模型特點

統一的多模態能力
同時具備多模態理解和生成能力,在視覺理解和圖像生成任務上均表現優異
混合專家架構
採用混合專家Transformer架構,最大化模型從豐富多樣的多模態信息中學習的能力
湧現特性
隨著訓練進展,模型展現出分階段湧現的能力,從基礎理解生成到複雜智能編輯
先進編輯能力
在自由形式的視覺操作、多視角合成和世界導航等任務上展現出超越傳統圖像編輯模型的能力

模型能力

多模態理解
文本到圖像生成
圖像編輯
自由形式視覺操作
多視角合成
世界導航

使用案例

內容創作
文本到圖像生成
根據文本描述生成高質量圖像
在GenEval基準測試中總體得分0.88,優於SD3-Medium等專業生成器
圖像編輯
智能圖像編輯
根據指令對圖像進行復雜編輯
在GEdit-Bench-EN和IntelligentBench等基準測試中表現優異
多模態理解
視覺問答
回答關於圖像內容的複雜問題
在MMBench、MMMU等標準多模態理解排行榜上超越當前頂級開源視覺語言模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase