O

Openelm 3B

由apple開發
OpenELM是一組開源高效語言模型,採用分層縮放策略優化參數分配,提升模型準確率。包含270M、450M、1.1B和3B四種參數規模,提供預訓練和指令調優版本。
下載量 1,436
發布時間 : 4/12/2024

模型概述

開源高效語言模型系列,通過分層參數分配策略實現更優性能,適用於多種自然語言處理任務。

模型特點

分層參數分配
在Transformer各層中智能分配參數,相比傳統均勻分配顯著提升模型效率
全流程開源
完整公開從數據準備到模型訓練、微調和評估的整套框架
多規模選擇
提供從2.7億到30億參數的不同規模模型,適應多樣化應用場景

模型能力

文本生成
零樣本學習
指令跟隨
語言理解

使用案例

教育
科學問答
基於SciQ等數據集的高準確率科學問題解答
3B模型在SciQ測試集達到92.7%準確率
內容創作
故事生成
根據提示詞生成連貫的敘事文本
支持中文提示如'很久很久以前'的故事開頭生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase