O

Openelm 450M

由apple開發
OpenELM是一組開放的高效語言模型,採用分層縮放策略優化參數分配,提升模型精度。提供2.7億至30億參數的預訓練及指令調優版本。
下載量 857
發布時間 : 4/12/2024

模型概述

OpenELM系列模型專注於通過高效的參數分配策略提升語言模型性能,適用於多種自然語言處理任務。

模型特點

分層縮放策略
在Transformer模型的每一層中高效分配參數,優化模型性能
多規模選擇
提供從2.7億到30億參數的不同規模模型,適應不同計算需求
完整開源框架
包含數據準備、訓練、微調和評估的完整流程代碼
透明研究支持
提供多個預訓練檢查點和訓練日誌,促進開放研究

模型能力

文本生成
語言理解
指令跟隨

使用案例

自然語言處理
文本生成
利用預訓練模型生成連貫的文本內容
指令跟隨
使用指令調優模型執行特定任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase