M

Minicpm4 0.5B

由 openbmb 开发
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个关键维度实现极致的效率提升。
下载量 415
发布时间 : 6/5/2025

模型简介

MiniCPM4系列是专门为端侧设备设计的高效大语言模型,0.5B版本拥有0.5亿参数,在1T的token上进行训练。

模型特点

高效模型架构
采用InfLLM v2可训练的稀疏注意力机制,在处理128K长文本时显著降低计算开销
高效学习算法
包含模型风洞2.0、BitCPM极致三元量化等创新技术,实现高效训练和压缩
高质量训练数据
使用UltraClean数据过滤与生成技术,构建高质量预训练和监督微调数据集
高效推理系统
提供CPM.cu轻量级CUDA推理框架和ArkInfer跨平台部署系统

模型能力

文本生成
对话交互
长文本理解
工具调用
调查报告生成

使用案例

内容创作
文章写作
根据用户提示生成高质量文章
示例中展示了AI相关文章的生成能力
旅游推荐
景点推荐
根据用户需求推荐旅游景点
示例中展示了北京5个旅游景点的推荐
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase