L

Libra 11b Base

由YifanXu開發
天秤座是一個基於大語言模型構建的解耦視覺系統,具備基礎多模態理解能力。
下載量 18
發布時間 : 5/15/2024

模型概述

該模型通過圖像-文本對訓練,能夠實現圖像到文本的轉換和理解,適用於多模態任務。

模型特點

多模態理解能力
通過圖像-文本對訓練,能夠理解圖像內容並生成相關文本描述。
解耦視覺系統
基於大語言模型構建,視覺系統與語言模型解耦,可能提供更靈活的架構。
CLIP模型集成
需要與預訓練的CLIP模型結合使用,可能增強了視覺特徵提取能力。

模型能力

圖像理解
圖像到文本轉換
多模態任務處理

使用案例

圖像理解與描述
圖像標註
為圖像生成描述性文本
視覺問答
回答關於圖像內容的問題
多模態應用
圖文匹配
判斷圖像與文本描述是否匹配
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase