E

E1 Math 1.5B

Developed by Salesforce
E1-Math-1.5BはDeepSeek-R1-Distilled-Qwen-1.5Bを微調整した言語モデルで、弾性推論とGRPO手法をサポートし、予算制約のある推論シナリオに適しています。
Downloads 295
Release Time : 5/7/2025

Model Overview

このモデルは予算制約のある推論戦略で訓練され、弾性推論を実現し、GRPO手法を組み込むことで、思考プロセスが中断した場合でも適応的に推論でき、追加の訓練なしで未経験の予算制約シナリオにも汎化できます。

Model Features

弾性推論
予算制約のある状況下での推論をサポートし、異なる計算リソース制限に適応します。
GRPO手法
思考プロセスが中断した場合でも適応的に推論でき、追加の訓練なしで未経験の予算制約シナリオにも汎化できます。
高性能
複数のトークン長で高い精度を示し、特に短いトークン長ではベースモデルよりも優れた性能を発揮します。

Model Capabilities

数学的推論
弾性推論
適応的推論

Use Cases

学術研究
数学問題解決
複雑な数学問題の解決に使用され、特にリソースが制限された環境で有効です。
複数のトークン長で高い精度を示します。
教育
数学補助教育
学生が数学問題を理解し解決するのを助け、弾性推論サポートを提供します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase