M

Mobilellm 125M

由facebook開發
MobileLLM是Meta專為資源受限設備優化的十億參數以下語言模型系列,通過深層窄結構設計顯著提升設備端推理效率。
下載量 1,675
發布時間 : 10/30/2024

模型概述

該模型系列採用優化Transformer架構,針對移動設備和邊緣計算場景設計,在常識推理等任務上超越同類參數規模模型表現。

模型特點

設備端優化架構
採用深層窄結構設計,結合嵌入共享和分組查詢注意力(GQA),顯著降低內存佔用
高效推理性能
125M版本在常識推理任務上較前代OPT-125M提升3.7%準確率
參數可擴展性
提供從125M到1.5B的多種參數規模,適應不同硬件條件

模型能力

文本生成
常識推理
設備端部署

使用案例

移動應用
智能鍵盤預測
在手機端實現低延遲的文本輸入預測
125M模型可在中端移動芯片實現即時推理
教育工具
離線學習助手
為無網絡環境下的教育設備提供問答功能
350M版本在ARC-Challenge測試集達52.1%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase