O

Openelm 1 1B Instruct

由apple開發
OpenELM是一組開源高效語言模型,採用分層縮放策略在Transformer模型的每一層中高效分配參數,從而提升模型精度。
下載量 1.5M
發布時間 : 4/12/2024

模型概述

OpenELM系列包含2.7億、4.5億、11億和30億參數的預訓練及指令調優模型,完整開源了訓練框架和評估流程。

模型特點

分層縮放策略
在Transformer模型的每一層中高效分配參數,提升模型精度
完整開源框架
提供從數據準備、訓練、微調到評估的完整流程
多規模選擇
提供從2.7億到30億參數的不同規模模型
指令調優版本
提供經過指令優化的模型版本,適合對話和指令跟隨任務

模型能力

文本生成
指令理解
問答系統
語言理解

使用案例

教育
智能問答系統
用於教育領域的知識問答和解釋
在SciQ數據集上達到90.6%準確率
研究
語言模型研究
作為基礎模型供研究人員進行實驗和改進
提供完整的訓練框架和評估流程
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase