M

Minigpt 4 LLaMA 7B

由wangrongsheng開發
MiniGPT-4是一個結合視覺和語言能力的多模態模型,基於Vicuna語言模型開發。
下載量 1,777
發布時間 : 4/22/2023

模型概述

MiniGPT-4是一個視覺-語言模型,能夠處理圖像和文本輸入,執行多模態理解和生成任務。

模型特點

預訓練權重轉換
提供轉換後的權重文件,簡化模型部署流程
多模態能力
同時處理視覺和語言信息,實現跨模態理解
輕量級架構
基於7B參數的相對輕量設計,平衡性能與效率

模型能力

圖像理解
文本生成
視覺問答
多模態推理

使用案例

內容生成
圖像描述生成
根據輸入圖像生成詳細的文字描述
智能交互
視覺問答系統
回答關於圖像內容的自然語言問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase