O

Openelm 270M

由apple開發
OpenELM是一組開源高效語言模型,採用分層縮放策略在Transformer模型的每一層中高效分配參數,提升準確性。
下載量 4,719
發布時間 : 4/12/2024

模型概述

OpenELM系列模型包括270M、450M、1.1B和3B參數的預訓練及指令調優模型,提供完整訓練框架和評估流程。

模型特點

分層縮放策略
在Transformer模型的每一層中高效分配參數,提升模型準確性。
完整開源框架
提供從數據準備、訓練、微調到評估的完整流程,促進開放研究。
多規模選擇
提供270M、450M、1.1B和3B四種參數規模的模型選擇。

模型能力

文本生成
指令跟隨
零樣本學習

使用案例

自然語言處理
問答系統
可用於構建基於知識的問答系統。
在SciQ數據集上達到84.70%準確率
文本補全
根據提示生成連貫的文本內容。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase