L

Libra 11b Base

Developed by YifanXu
天秤座是一個基於大語言模型構建的解耦視覺系統,具備基礎多模態理解能力。
Downloads 18
Release Time : 5/15/2024

Model Overview

該模型通過圖像-文本對訓練,能夠實現圖像到文本的轉換和理解,適用於多模態任務。

Model Features

多模態理解能力
通過圖像-文本對訓練,能夠理解圖像內容並生成相關文本描述。
解耦視覺系統
基於大語言模型構建,視覺系統與語言模型解耦,可能提供更靈活的架構。
CLIP模型集成
需要與預訓練的CLIP模型結合使用,可能增強了視覺特徵提取能力。

Model Capabilities

圖像理解
圖像到文本轉換
多模態任務處理

Use Cases

圖像理解與描述
圖像標註
為圖像生成描述性文本
視覺問答
回答關於圖像內容的問題
多模態應用
圖文匹配
判斷圖像與文本描述是否匹配
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase