M

Minicpm4 8B GGUF

由openbmb開發
MiniCPM4 是一款專為端側設備設計的高效大語言模型,在相同規模下保持最優性能的同時實現了極致的效率提升,在典型端側芯片上可實現超 5 倍的生成加速。
下載量 324
發布時間 : 6/13/2025

模型概述

MiniCPM4 是專為端側設備優化的高效大語言模型,通過模型架構、訓練數據、訓練算法和推理系統四個維度的創新,實現了高性能與高效率的平衡。

模型特點

高效模型架構
採用可訓練的稀疏注意力機制架構,在128K長文本處理中,每個標記僅需與不到5%的標記計算相關性,顯著降低長文本的計算開銷。
高效學習算法
引入下游任務性能的縮放預測方法,實現更精確的模型訓練配置搜索;採用FP8低精度計算技術,結合多標記預測訓練策略。
高質量訓練數據
基於高效數據驗證構建迭代數據清理策略,使用高質量中英文預訓練數據集UltraFinweb和大規模監督微調數據集UltraChat v2。
高效推理系統
集成稀疏注意力、模型量化和推測採樣,實現高效預填充和解碼;支持在多個後端環境進行高效部署。
極致量化技術
通過BitCPM技術將模型參數位寬壓縮至3個值,實現90%的極端模型位寬縮減。

模型能力

文本生成
長文本理解
工具調用
調查論文生成
推測推理加速

使用案例

內容生成
調查論文生成
基於用戶查詢自主生成可信的長篇調查論文
效率優化
推測推理加速
通過Eagle頭和FRSpec技術實現超5倍的生成加速
在典型端側芯片上實現超5倍加速
邊緣計算
端側部署
專為端側設備優化的高效推理
在資源受限設備上保持高性能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase