M

Minicpm4 0.5B

由openbmb開發
MiniCPM4是專為端側設備設計的高效大語言模型,通過系統創新在模型架構、訓練數據、訓練算法和推理系統四個關鍵維度實現極致的效率提升。
下載量 415
發布時間 : 6/5/2025

模型概述

MiniCPM4系列是專門為端側設備設計的高效大語言模型,0.5B版本擁有0.5億參數,在1T的token上進行訓練。

模型特點

高效模型架構
採用InfLLM v2可訓練的稀疏注意力機制,在處理128K長文本時顯著降低計算開銷
高效學習算法
包含模型風洞2.0、BitCPM極致三元量化等創新技術,實現高效訓練和壓縮
高質量訓練數據
使用UltraClean數據過濾與生成技術,構建高質量預訓練和監督微調數據集
高效推理系統
提供CPM.cu輕量級CUDA推理框架和ArkInfer跨平臺部署系統

模型能力

文本生成
對話交互
長文本理解
工具調用
調查報告生成

使用案例

內容創作
文章寫作
根據用戶提示生成高質量文章
示例中展示了AI相關文章的生成能力
旅遊推薦
景點推薦
根據用戶需求推薦旅遊景點
示例中展示了北京5個旅遊景點的推薦
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase