M

Minicpm 1B Sft Bf16

openbmbによって開発
MiniCPMは面壁智能と清華大学自然言語処理研究所が共同で開発したエッジサイド大規模言語モデルシリーズで、コアモデルにはわずか12億の非単語埋め込みパラメータしか含まれておらず、複数の評価でより大規模なオープンソースモデルを上回っています。
ダウンロード数 638
リリース時間 : 4/10/2024

モデル概要

MiniCPMは効率的なエッジサイド大規模言語モデルシリーズで、優れたテキスト生成と理解能力を持ち、英語と中国語をサポートし、さまざまな自然言語処理タスクに適しています。

モデル特徴

高効率性能
12億パラメータのモデルが、Llama2 - 13B、MPT - 30Bなどのより大規模なモデルを複数の評価で上回っています。
エッジサイドデプロイ
Int4量子化後、携帯端末でストリーミング推論を実現でき、生成速度は人間の話す速度に近くなります。
マルチモーダル対応
MiniCPM - 2Bをベースに構築されたMiniCPM - Vは、携帯端末で動作可能な最初のマルチモーダル大規模モデルです。
低コスト開発
単一の1080/2080グラフィックカードで効率的に微調整でき、3090/4090グラフィックカードでは全パラメータの微調整がサポートされます。

モデル能力

テキスト生成
対話システム
命令追従
数学的推論
コード生成
マルチモーダル理解

使用事例

スマートアシスタント
知識問答
さまざまな知識的な質問に回答します。
公開評価ではMistral - 7Bに近い性能を示し、中国語/数学/コード能力はより優れています。
教育
数学指導
数学の問題を解き、推論過程を説明します。
同規模のモデルよりも数学能力が優れています。
開発支援
コード生成
説明に基づいてコード断片を生成します。
同規模のモデルよりもコード能力が優れています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase