O

Openelm 450M

Developed by apple
OpenELM是一组开放的高效语言模型,采用分层缩放策略优化参数分配,提升模型精度。提供2.7亿至30亿参数的预训练及指令调优版本。
Downloads 857
Release Time : 4/12/2024

Model Overview

OpenELM系列模型专注于通过高效的参数分配策略提升语言模型性能,适用于多种自然语言处理任务。

Model Features

分层缩放策略
在Transformer模型的每一层中高效分配参数,优化模型性能
多规模选择
提供从2.7亿到30亿参数的不同规模模型,适应不同计算需求
完整开源框架
包含数据准备、训练、微调和评估的完整流程代码
透明研究支持
提供多个预训练检查点和训练日志,促进开放研究

Model Capabilities

文本生成
语言理解
指令跟随

Use Cases

自然语言处理
文本生成
利用预训练模型生成连贯的文本内容
指令跟随
使用指令调优模型执行特定任务
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase