M

Minicpm V 2 6

Developed by openbmb
MiniCPM-Vはモバイル端末向けのGPT-4Vレベルのマルチモーダル大規模言語モデルで、単一画像、複数画像、動画の理解をサポートし、視覚、光学文字認識などの機能を備えています。
Downloads 91.52k
Release Time : 8/4/2024

Model Overview

MiniCPM-Vはマルチモーダル大規模言語モデルで、モバイル端末でGPT-4Vレベルのマルチモーダル理解能力を実現し、単一画像、複数画像、動画コンテンツの理解と分析をサポートします。

Model Features

モバイル端末展開
モバイル端末向けに最適化されたマルチモーダル大規模言語モデルで、効率的な動作を実現。
マルチモーダル理解
単一画像、複数画像、動画コンテンツの理解と分析をサポート。
光学文字認識
OCR機能を備え、画像からテキスト情報を抽出可能。

Model Capabilities

画像理解
動画理解
光学文字認識
マルチモーダル対話

Use Cases

コンテンツ分析
画像内容説明
アップロードされた画像の内容分析と説明文生成。
正確な画像内容説明テキストを生成。
動画内容理解
動画内容を分析し要約やキーフレーム説明を生成。
動画のキー情報を抽出しテキスト要約を生成。
ドキュメント処理
画像文字認識
文字を含む画像からテキスト内容を抽出。
画像中の文字情報を正確に認識・抽出。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase