O

Olmo 2 0425 1B SFT

Developed by allenai
OLMo 2 1B SFT是基于OLMo-2-0425-1B模型的监督微调版本,在Tulu 3数据集上训练,旨在实现多种任务的最先进性能。
Downloads 1,759
Release Time : 4/24/2025

Model Overview

这是一个开放语言模型,主要用于英语文本生成任务,基于Apache 2.0许可证发布,适合研究和教育用途。

Model Features

开放语言模型
完全开放源代码、权重和训练数据,推动语言模型科学研究
多任务优化
在Tulu 3数据集上微调,优化了MATH、GSM8K和IFEval等多种任务性能
透明训练
公开所有训练代码、检查点和日志,确保研究可复现性

Model Capabilities

文本生成
对话系统
数学问题解答
事实问答

Use Cases

教育
数学问题解答
解答GSM8K和MATH数据集中的数学问题
在GSM8K上达到52.1分,MATH上13.2分
研究
语言模型研究
用于语言模型行为和能力的研究
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase