E1-Math-1.5Bオープンソース言語モデル - 予算が限られていても使え、柔軟な推論で簡単に演繹する

Home

E1 Math 1.5B

Developed by Salesforce

E1-Math-1.5BはDeepSeek-R1-Distilled-Qwen-1.5Bを微調整した言語モデルで、弾性推論とGRPO手法をサポートし、予算制約のある推論シナリオに適しています。

大規模言語モデル

Transformers

#弾性推論 #予算制約付き推論 #数学的推論

Downloads 295

Release Time : 5/7/2025

Model Overview

このモデルは予算制約のある推論戦略で訓練され、弾性推論を実現し、GRPO手法を組み込むことで、思考プロセスが中断した場合でも適応的に推論でき、追加の訓練なしで未経験の予算制約シナリオにも汎化できます。

Model Features

弾性推論

予算制約のある状況下での推論をサポートし、異なる計算リソース制限に適応します。

GRPO手法

思考プロセスが中断した場合でも適応的に推論でき、追加の訓練なしで未経験の予算制約シナリオにも汎化できます。

高性能

複数のトークン長で高い精度を示し、特に短いトークン長ではベースモデルよりも優れた性能を発揮します。

Model Capabilities

数学的推論

弾性推論

適応的推論

Use Cases

学術研究

数学問題解決

複雑な数学問題の解決に使用され、特にリソースが制限された環境で有効です。

複数のトークン長で高い精度を示します。

教育

数学補助教育

学生が数学問題を理解し解決するのを助け、弾性推論サポートを提供します。

🚀 E1-Math-1.5B 言語モデル

E1-Math-1.5Bは、高度な言語処理能力を持つモデルで、DeepSeek-R1-Distilled-Qwen-1.5Bをベースに微調整されています。予算制約下でのロールアウト戦略を用いたElastic Reasoningに特化して訓練されており、思考過程が中断された場合でも適応的に推論し、追加の訓練なしで未知の予算制約に対しても効果的に汎化することができます。

🚀 クイックスタート

詳細な使用方法については、リポジトリを参照してください。

✨ 主な機能

E1-Math-1.5Bは、DeepSeek-R1-Distilled-Qwen-1.5Bをベースに微調整された言語モデルです。予算制約下でのロールアウト戦略を用いてElastic Reasoningの訓練を行っており、思考過程が中断された場合でも適応的に推論し、追加の訓練なしで未知の予算制約に対しても効果的に汎化することができます。

📦 インストール

原文書にインストール手順は記載されていません。

📚 ドキュメント

モデル情報

プロパティ	詳細
ライブラリ名	transformers
データセット	agentica-org/DeepScaleR-Preview-Dataset
ベースモデル	deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
ライセンス	cc-by-nc-4.0

パフォーマンス (Avg@16)

モデル	トークン数	正解率 (%)	トークン数	正解率 (%)	トークン数	正解率 (%)	トークン数	正解率 (%)	トークン数	正解率 (%)
DeepScaleR-1.5B	10050	41.0	1488	5.2	1904	9.6	2809	15.8	3700	22.7
E1-Math-1.5B	6825	35.0	1340	13.5	1799	17.5	2650	24.8	3377	27.9

📄 ライセンス

このモデルは、cc-by-nc-4.0ライセンスの下で提供されています。

🔖 引用

@article{xu2025scalable,
  title={Scalable Chain of Thoughts via Elastic Reasoning},
  author={Xu, Yuhui and Dong, Hanze and Wang, Lei and Sahoo, Doyen and Li, Junnan and Xiong, Caiming},
  journal={arXiv preprint arXiv:2505.05315},
  year={2025}
}

⚠️ 倫理的な考慮事項

このリリースは学術論文のサポートのための研究目的のみを対象としています。当社のモデル、データセット、コードは、すべての下流の目的に特に設計または評価されていません。ユーザーは、このモデルをデプロイする前に、精度、安全性、公正性に関連する潜在的な問題を評価し、対処することを強くお勧めします。ユーザーは、AIの一般的な制限を考慮し、適用可能な法律を遵守し、特にエラーや誤用が人々の生活、権利、または安全に重大な影響を与える可能性のある高リスクシナリオのユースケースを選択する際には、ベストプラクティスを活用することをお勧めします。ユースケースに関する詳細なガイダンスについては、当社のAUPおよびAI AUPを参照してください。