開源libra-11b-base模型 - 支持多模態理解的解耦視覺系統

Home

Libra 11b Base

Developed by YifanXu

天秤座是一個基於大語言模型構建的解耦視覺系統，具備基礎多模態理解能力。

圖像生成文本

Transformers

Open Source License:Apache-2.0 #多模態理解 #圖像轉文本 #CLIP集成

Downloads 18

Release Time : 5/15/2024

Model Overview

該模型通過圖像-文本對訓練，能夠實現圖像到文本的轉換和理解，適用於多模態任務。

Model Features

多模態理解能力

通過圖像-文本對訓練，能夠理解圖像內容並生成相關文本描述。

解耦視覺系統

基於大語言模型構建，視覺系統與語言模型解耦，可能提供更靈活的架構。

CLIP模型集成

需要與預訓練的CLIP模型結合使用，可能增強了視覺特徵提取能力。

Model Capabilities

圖像理解

圖像到文本轉換

多模態任務處理

Use Cases

圖像理解與描述

圖像標註

為圖像生成描述性文本

視覺問答

回答關於圖像內容的問題

多模態應用

圖文匹配

判斷圖像與文本描述是否匹配

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Libra 11b Base

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Libra-Base

🚀 快速開始

📄 許可證