P

Paligemma 3B Chat V0.2

由BUAADreamer開發
基於google/paligemma-3b-mix-448微調的多模態對話模型,專為多輪對話場景優化
下載量 80
發布時間 : 6/4/2024

模型概述

該模型是一個視覺語言模型,能夠理解和生成關於圖像內容的自然語言描述,支持中英文多輪對話。

模型特點

多模態理解
能夠同時處理圖像和文本輸入,理解圖像內容並生成相關描述
多輪對話優化
專為對話場景設計,支持連貫的多輪交互
雙語支持
同時支持英文和中文的輸入輸出
高效微調
僅調整語言模型和投影層參數,保持視覺編碼器凍結

模型能力

圖像內容理解
多輪對話
雙語文本生成
視覺問答

使用案例

智能客服
產品圖像諮詢
用戶上傳產品圖片,模型回答相關問題
提供準確的產品描述和相關信息
教育輔助
圖像學習助手
幫助學生理解教材中的圖像內容
提供詳細的圖像解釋和相關知識點
內容審核
圖像內容分析
自動識別和描述上傳圖像的內容
輔助人工審核,提高效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase