O

Openelm 1 1B

由apple開發
OpenELM是由蘋果公司推出的高效語言模型系列,採用分層縮放策略優化參數分配,提供270M至3B不同規模的預訓練及指令調優模型。
下載量 683
發布時間 : 4/25/2025

模型概述

OpenELM是一個開放的高效語言模型系列,專注於通過分層縮放策略提升模型性能,適用於多種自然語言處理任務。

模型特點

分層縮放策略
在Transformer模型的每一層中智能分配參數,提高模型效率
開放研究框架
提供完整的訓練、微調和評估流程,促進開放研究
多規模選擇
提供從270M到3B不同參數規模的模型版本

模型能力

文本生成
零樣本學習
指令跟隨

使用案例

自然語言處理
開放域問答
回答各種領域的自然語言問題
在ARC-c等基準測試中表現良好
文本補全
根據提示生成連貫的文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase