M

Minicpm 1B Sft Bf16

由openbmb開發
MiniCPM是面壁智能與清華大學自然語言處理實驗室聯合研發的端側大語言模型系列,核心模型僅含12億非詞嵌入參數,在多項評測中超越更大規模的開源模型。
下載量 638
發布時間 : 4/10/2024

模型概述

MiniCPM是一個高效的端側大語言模型系列,具有優秀的文本生成和理解能力,支持中英文,適用於多種自然語言處理任務。

模型特點

高效性能
12億參數模型在多項評測中超越Llama2-13B、MPT-30B等更大規模模型
端側部署
經Int4量化後可在手機端實現流式推理,生成速度接近人類語速
多模態支持
基於MiniCPM-2B構建的MiniCPM-V是首個可在手機端運行的多模態大模型
低成本開發
單張1080/2080顯卡可高效微調,3090/4090顯卡支持全參數微調

模型能力

文本生成
對話系統
指令跟隨
數學推理
代碼生成
多模態理解

使用案例

智能助手
知識問答
回答各類知識性問題
在公開評測中表現接近Mistral-7B,中文/數學/代碼能力更優
教育
數學輔導
解答數學問題並解釋推理過程
數學能力優於同規模模型
開發輔助
代碼生成
根據描述生成代碼片段
代碼能力優於同規模模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase