M

Minicpm V 2 6

Developed by openbmb
MiniCPM-V是一個手機端GPT-4V級多模態大語言模型,支持單圖、多圖與視頻理解,具備視覺、光學字符識別等功能。
Downloads 91.52k
Release Time : 8/4/2024

Model Overview

MiniCPM-V是一個多模態大語言模型,能夠在手機端實現GPT-4V級別的多模態理解能力,支持單張圖片、多張圖片以及視頻內容的理解與分析。

Model Features

手機端部署
專為手機端優化的多模態大語言模型,實現高效運行。
多模態理解
支持單圖、多圖和視頻內容的理解與分析。
光學字符識別
具備OCR能力,可從圖像中提取文本信息。

Model Capabilities

圖像理解
視頻理解
光學字符識別
多模態對話

Use Cases

內容分析
圖像內容描述
對上傳的圖片進行內容分析和描述生成。
生成準確的圖片內容描述文本。
視頻內容理解
分析視頻內容並生成摘要或關鍵幀描述。
提取視頻關鍵信息並生成文本摘要。
文檔處理
圖像文字識別
從包含文字的圖片中提取文本內容。
準確識別並提取圖片中的文字信息。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase