M

Minicpm 2B Dpo Bf16

由openbmb開發
MiniCPM是由面壁智能與清華大學自然語言處理實驗室聯合開源的一系列端側大語言模型,核心語言模型MiniCPM-2B僅含24億非詞嵌入參數。
下載量 463
發布時間 : 1/30/2024

模型概述

MiniCPM-2B是一個高效能的端側大語言模型,經過監督微調和直接偏好優化後,在多項評測中表現優異,支持中英文,並可通過量化在手機端運行。

模型特點

高效端側部署
經Int4量化後可在手機端實現流式推理,生成速度略快於人類語速。
多模態能力
基於MiniCPM-2B構建的端側多模態大模型MiniCPM-V,在同等規模模型中綜合性能最優。
低成本二次開發
單張1080/2080顯卡即可高效微調參數,3090/4090顯卡支持全參數微調,單機即可完成持續訓練。
優異性能表現
在公開綜合評測中表現接近Mistral-7B,整體性能超越Llama2-13B、MPT-30B、Falcon-40B等模型。

模型能力

文本生成
對話系統
代碼生成
數學推理
多模態理解

使用案例

教育
知識問答
回答各類學科知識問題
在中文、數學與代碼能力評測中表現優異
開發
代碼輔助
生成和優化代碼
在代碼生成評測中表現良好
移動應用
手機端智能助手
在手機端運行的語言模型應用
支持流式推理,生成速度接近人類語速
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase