M

Minicpm V 2 6

由openbmb開發
MiniCPM-V是一個手機端GPT-4V級多模態大語言模型,支持單圖、多圖與視頻理解,具備視覺、光學字符識別等功能。
下載量 91.52k
發布時間 : 8/4/2024

模型概述

MiniCPM-V是一個多模態大語言模型,能夠在手機端實現GPT-4V級別的多模態理解能力,支持單張圖片、多張圖片以及視頻內容的理解與分析。

模型特點

手機端部署
專為手機端優化的多模態大語言模型,實現高效運行。
多模態理解
支持單圖、多圖和視頻內容的理解與分析。
光學字符識別
具備OCR能力,可從圖像中提取文本信息。

模型能力

圖像理解
視頻理解
光學字符識別
多模態對話

使用案例

內容分析
圖像內容描述
對上傳的圖片進行內容分析和描述生成。
生成準確的圖片內容描述文本。
視頻內容理解
分析視頻內容並生成摘要或關鍵幀描述。
提取視頻關鍵信息並生成文本摘要。
文檔處理
圖像文字識別
從包含文字的圖片中提取文本內容。
準確識別並提取圖片中的文字信息。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase