O

Openelm 270M Instruct

由 apple 开发
OpenELM是一系列开放、高效的语言模型,采用逐层缩放策略在Transformer模型的每一层内高效分配参数,提高了准确性。
下载量 1,593
发布时间 : 4/12/2024

模型简介

OpenELM是一个高效的语言模型家族,通过创新的参数分配策略优化模型性能,适用于多种自然语言处理任务。

模型特点

高效参数分配
采用逐层缩放策略,在Transformer模型的每一层内高效分配参数,提高了模型的准确性。
多参数模型发布
发布了参数分别为2.7亿、4.5亿、11亿和30亿的预训练模型和指令调优模型。
完整框架开源
发布了完整的框架,包括数据准备、训练、微调、评估等流程,以及多个预训练检查点和训练日志,方便进行开放研究。

模型能力

文本生成
零样本学习
指令跟随

使用案例

教育
科学问答
回答科学相关的问题
在SciQ数据集上达到90.60%的准确率
通用推理
常识推理
解决需要常识推理的问题
在HellaSwag数据集上达到76.87%的准确率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase