L

Liquid V1 7B

由Junfeng5開發
Liquid 是一種自迴歸生成範式,通過將圖像標記化為離散代碼並在共享特徵空間中學習這些代碼嵌入與文本標記,實現了視覺理解與生成的無縫融合。
下載量 11.35k
發布時間 : 2/21/2025

模型概述

Liquid 是一種創新的多模態大語言模型(MLLM),僅使用單一的大語言模型(LLM)就實現了視覺與文本的無縫融合,無需依賴外部預訓練的視覺嵌入。

模型特點

單一模型多模態融合
僅使用單一的大語言模型(LLM)實現視覺與文本的無縫融合,無需依賴外部預訓練的視覺嵌入。
自迴歸生成範式
通過將圖像標記化為離散代碼,並在共享的特徵空間中學習這些代碼嵌入與文本標記。
多規模變體
提供六種參數規模的預訓練版本(0.5B 至 32B)和基於 GEMMA 的 7B 指令調優版本。
理解與生成相互促進
探索了多模態混合模型的擴展規律,發現理解任務與生成任務之間相互促進的現象。

模型能力

文本生成
圖像生成
視覺理解
多模態融合

使用案例

內容創作
多模態內容生成
根據文本描述生成圖像,或根據圖像生成描述文本。
實現文本與圖像之間的無縫轉換。
教育
交互式學習工具
通過多模態交互幫助學生理解複雜概念。
提升學習體驗和理解效果。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase