M

Minicpm 2B Sft Fp32

openbmbによって開発
MiniCPMは面壁智能と清華大学自然言語処理研究所が共同でオープンソース化した一連のエッジサイド言語大規模モデルで、主体の言語モデルMiniCPM-2Bは非単語埋め込みパラメータ数がわずか24億(2.4B)です。
ダウンロード数 218
リリース時間 : 1/30/2024

モデル概要

MiniCPMはエッジサイド向けの効率的な言語大規模モデルで、教師付き微調整(SFT)と直接嗜好最適化(DPO)を行った後、複数の評価で優れた成績を収め、英語と中国語をサポートし、携帯端末にデプロイ可能です。

モデル特徴

エッジサイドでの効率的なデプロイ
Int4量子化後、携帯電話でデプロイと推論が可能で、ストリーミング出力速度は人間の話す速度よりやや速いです。
優れた性能
公開評価ではMistral - 7Bと同等の成績を収め、全体的な性能はLlama2 - 13B、MPT - 30B、Falcon - 40Bなどのモデルを上回ります。
マルチモーダル対応
MiniCPM - 2Bをベースに構築されたエッジサイドマルチモーダル大規模モデルMiniCPM - Vは、同規模のモデルを上回る性能を発揮します。
低コスト開発
1枚の1080/2080グラフィックカードだけで効率的にパラメータの効率的な微調整が可能で、二次開発コストが低いです。

モデル能力

テキスト生成
対話システム
マルチモーダル理解
コード生成
数学的推論

使用事例

スマートアシスタント
質問応答システム
ユーザーが提出した様々な質問に回答します。
中国語、数学、コード能力で優れた成績を収めます。
教育
学習支援
学生が学習中に直面する問題を解決するのを支援します。
数学的推論能力で良好な成績を収めます。
開発支援
コード生成
開発者がコード断片を生成するのを支援します。
コード能力評価で優れた成績を収めます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase