M

Minicpm4 0.5B

Developed by openbmb
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个关键维度实现极致的效率提升。
Downloads 415
Release Time : 6/5/2025

Model Overview

MiniCPM4系列是专门为端侧设备设计的高效大语言模型,0.5B版本拥有0.5亿参数,在1T的token上进行训练。

Model Features

高效模型架构
采用InfLLM v2可训练的稀疏注意力机制,在处理128K长文本时显著降低计算开销
高效学习算法
包含模型风洞2.0、BitCPM极致三元量化等创新技术,实现高效训练和压缩
高质量训练数据
使用UltraClean数据过滤与生成技术,构建高质量预训练和监督微调数据集
高效推理系统
提供CPM.cu轻量级CUDA推理框架和ArkInfer跨平台部署系统

Model Capabilities

文本生成
对话交互
长文本理解
工具调用
调查报告生成

Use Cases

内容创作
文章写作
根据用户提示生成高质量文章
示例中展示了AI相关文章的生成能力
旅游推荐
景点推荐
根据用户需求推荐旅游景点
示例中展示了北京5个旅游景点的推荐
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase