O

Openelm 3B Instruct

由apple開發
OpenELM是一組開源高效語言模型,採用分層參數分配策略提升模型精度,包含2.7億至30億參數的預訓練及指令調優版本。
下載量 8,716
發布時間 : 4/12/2024

模型概述

OpenELM是由蘋果公司推出的開源高效語言模型系列,通過創新的分層參數分配策略優化Transformer層內參數分佈,顯著提升模型效率。該系列包含多種規模的預訓練模型及經過指令微調的版本,適用於各類自然語言處理任務。

模型特點

分層參數分配
在Transformer各層中智能分配參數,相比傳統均勻分配顯著提升模型效率
完整開源生態
提供從數據準備到訓練評估的全套工具鏈,包括CoreNet訓練框架
多規模選擇
提供從2.7億到30億參數的多種模型規模,滿足不同計算需求
指令調優版本
除基礎預訓練模型外,還發布經過指令微調的版本,優化對話交互能力

模型能力

文本生成
語言理解
問答系統
指令跟隨

使用案例

教育研究
學術問答
基於SciQ等科學問答數據集的優異表現,適合教育場景的知識問答應用
在SciQ數據集上達到92.7%準確率
內容生成
創意寫作
利用模型的文本生成能力輔助故事創作
示例中展示了'很久很久以前...'的故事開頭生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase