M

Minicpm V

由openbmb開發
MiniCPM-V是一款高效輕量級多模態模型,專為終端設備部署優化,支持中英雙語交互,性能超越同規模模型。
下載量 19.74k
發布時間 : 1/30/2024

模型概述

基於SigLip-400M和MiniCPM-2.4B構建的高效多模態模型,通過感知器重採樣器連接,具備卓越的視覺理解和語言生成能力。

模型特點

極致高效
僅需64個視覺token,內存佔用低,可在主流GPU、個人電腦甚至手機終端流暢運行
卓越性能
在MMMU、MME等基準測試中超越同規模模型,部分場景比肩9.6B參數的Qwen-VL-Chat
雙語支持
首個支持中英雙語交互的終端可部署多模態模型,基於ICLR 2024焦點論文技術
多模態理解
支持單圖/多圖/視頻理解,iPad即時視頻分析等先進功能

模型能力

圖像內容理解
視覺問答
多圖關聯分析
視頻內容理解
中英雙語交互
即時視頻處理

使用案例

教育
動植物識別教學
通過攝像頭即時識別動植物並講解特性
示例展示中準確識別蘑菇種類和蛇類特徵
智能終端
移動端視覺助手
在手機端實現即時圖像理解和問答
已支持Android/HarmonyOS系統部署
內容分析
多圖關聯理解
分析多張圖像的關聯內容和邏輯關係
在MMbench測試中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase