O

Openelm 450M

Developed by apple
OpenELM是一組開放的高效語言模型,採用分層縮放策略優化參數分配,提升模型精度。提供2.7億至30億參數的預訓練及指令調優版本。
Downloads 857
Release Time : 4/12/2024

Model Overview

OpenELM系列模型專注於通過高效的參數分配策略提升語言模型性能,適用於多種自然語言處理任務。

Model Features

分層縮放策略
在Transformer模型的每一層中高效分配參數,優化模型性能
多規模選擇
提供從2.7億到30億參數的不同規模模型,適應不同計算需求
完整開源框架
包含數據準備、訓練、微調和評估的完整流程代碼
透明研究支持
提供多個預訓練檢查點和訓練日誌,促進開放研究

Model Capabilities

文本生成
語言理解
指令跟隨

Use Cases

自然語言處理
文本生成
利用預訓練模型生成連貫的文本內容
指令跟隨
使用指令調優模型執行特定任務
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase