M

Minicpm4 8B GGUF

由Mungert開發
MiniCPM4-8B是專為端側設備設計的高效大語言模型,通過模型架構、訓練數據、訓練算法和推理系統四個維度的創新,實現了極致的效率提升。
下載量 906
發布時間 : 6/13/2025

模型概述

MiniCPM4-8B是一個80億參數的大語言模型,在8T個token上進行訓練,專為邊緣設備優化,支持高達32,768個token的上下文長度,並可通過RoPE縮放技術擴展至131,072個token。

模型特點

高效稀疏注意力機制
採用InfLLM v2可訓練的稀疏注意力機制,在處理128K長文本時每個token只需與不到5%的token計算相關性,顯著減少計算開銷。
極致量化技術
支持BitCPM極致三元量化,將模型參數壓縮為三元值,實現90%的比特寬度減少。
長上下文支持
原生支持32,768個token上下文長度,通過LongRoPE技術可擴展至131,072個token。
端側優化
專為邊緣設備設計,在典型端側芯片上可實現超過5倍的生成加速。

模型能力

長文本生成
多輪對話
知識密集型任務處理
推理密集型任務處理
工具調用

使用案例

內容生成
文章寫作
根據用戶提示生成高質量的長篇文章
可生成結構完整、邏輯清晰的專業文章
智能助手
旅遊推薦
為用戶推薦旅遊景點並提供詳細介紹
能生成包含多個景點的詳細推薦列表
學術研究
文獻綜述
根據用戶查詢自主生成可信的長篇調查論文
可生成結構完整的學術綜述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase