M

Minicpm 2B Sft Fp32

由openbmb開發
MiniCPM 是面壁智能與清華大學自然語言處理實驗室共同開源的系列端側語言大模型,主體語言模型 MiniCPM-2B 僅有 24億(2.4B)的非詞嵌入參數量。
下載量 218
發布時間 : 1/30/2024

模型概述

MiniCPM 是面向端側的高效語言大模型,經過監督微調(SFT)和直接偏好優化(DPO)後,在多項評測中表現優異,支持中英文,可在手機端部署。

模型特點

端側高效部署
經過 Int4 量化後可在手機上進行部署推理,流式輸出速度略高於人類說話速度。
性能優異
在公開評測中表現與 Mistral-7B 相近,整體性能超越 Llama2-13B、MPT-30B、Falcon-40B 等模型。
多模態支持
基於 MiniCPM-2B 構建的端側多模態大模型 MiniCPM-V,性能超越同規模模型。
低成本開發
僅需一張1080/2080顯卡即可高效進行參數高效微調,二次開發成本較低。

模型能力

文本生成
對話系統
多模態理解
代碼生成
數學推理

使用案例

智能助手
問答系統
回答用戶提出的各種問題
在中文、數學、代碼能力上表現優異
教育
學習輔助
幫助學生解答學習問題
在數學推理能力上表現良好
開發輔助
代碼生成
輔助開發者生成代碼片段
在代碼能力評測中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase