L

Libra 11b Chat

由YifanXu開發
基於Libra-Base通過指令微調開發的多模態對話模型,具備圖像理解和文本生成能力
下載量 18
發布時間 : 5/16/2024

模型概述

這是一個基於大語言模型構建的解耦視覺系統,能夠處理圖像到文本的轉換任務

模型特點

多模態理解
結合視覺和語言模態,實現圖像內容的理解和描述
指令微調
通過特定指令進行微調,優化對話交互能力
解耦視覺系統
採用分離的視覺和語言處理模塊,提高系統靈活性

模型能力

圖像內容理解
圖像描述生成
多模態對話
視覺問答

使用案例

智能助手
圖像描述生成
為視覺障礙用戶描述圖像內容
生成準確、自然的圖像描述
視覺問答
回答用戶關於圖像內容的提問
提供與圖像內容相關的準確回答
內容審核
違規內容識別
識別圖像中的不當內容
標記潛在違規圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase