L

Libra 11b Base

由 YifanXu 开发
天秤座是一个基于大语言模型构建的解耦视觉系统,具备基础多模态理解能力。
下载量 18
发布时间 : 5/15/2024

模型简介

该模型通过图像-文本对训练,能够实现图像到文本的转换和理解,适用于多模态任务。

模型特点

多模态理解能力
通过图像-文本对训练,能够理解图像内容并生成相关文本描述。
解耦视觉系统
基于大语言模型构建,视觉系统与语言模型解耦,可能提供更灵活的架构。
CLIP模型集成
需要与预训练的CLIP模型结合使用,可能增强了视觉特征提取能力。

模型能力

图像理解
图像到文本转换
多模态任务处理

使用案例

图像理解与描述
图像标注
为图像生成描述性文本
视觉问答
回答关于图像内容的问题
多模态应用
图文匹配
判断图像与文本描述是否匹配
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase