O

Openelm 450M Instruct

由apple開發
OpenELM是一組開源高效語言模型,採用分層縮放策略優化參數分配,包含2.7億至30億參數的預訓練及指令調優版本。
下載量 114.41k
發布時間 : 4/12/2024

模型概述

OpenELM系列模型通過分層縮放策略提升Transformer模型效率,提供從2.7億到30億參數的不同規模版本,適用於多種自然語言處理任務。

模型特點

分層縮放策略
在Transformer各層中智能分配參數,顯著提升模型效率
完整開源框架
提供從數據準備到評估的全流程工具鏈,促進開放研究
多規模選擇
提供2.7億至30億參數的不同規模模型,適應多樣化需求

模型能力

文本生成
指令跟隨
零樣本學習

使用案例

內容創作
故事續寫
根據給定開頭自動生成連貫的故事內容
示例中展示了'從前有座山'的續寫能力
研究開發
語言模型研究
可作為高效模型架構研究的基線模型
技術報告中包含與其他模型的對比數據
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase