Light - R1 - 7B - DSオープンソース数学モデル - 無料で利用可能で、数学のベンチマークテストで優れた結果を収めます！

ホーム

Light R1 7B DS

qihoo360によって開発

Light-R1-7B-DSはDeepSeek-R1-Distill-Qwen-7Bをファインチューニングしたオープンソースの7B数学モデルで、AIME24や25などの数学ベンチマークテストで優れた性能を発揮します。

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #数学推論SOTA #少量データファインチューニング #競技問題解答

ダウンロード数 1,414

リリース時間 : 4/25/2025

モデル概要

現在オープンソースで利用可能な7B数学モデルの中で最高の性能を誇り、わずか3KのSFTデータでファインチューニングすることでSOTAレベルの性能を実現、特に数学推論タスクに優れています。

モデル特徴

効率的なファインチューニング

わずか3KのSFTデータでファインチューニングするだけでSOTA性能を達成、データの効率性を証明

数学推論能力

AIME24、AIME25、GPQAなどの数学ベンチマークテストで優れた成績

データ汚染除去

正確なマッチングとN-gramマッチングによる厳格なデータ汚染除去処理を実施

モデル能力

数学問題解決

複雑な推論

テキスト生成

使用事例

教育

数学競技問題解答

AIMEなどの数学競技問題を解答

AIME24テストで59.1点を達成

数学教育支援

学生が複雑な数学概念を理解するのを支援

研究

数学推論研究

数学推論能力研究のベンチマークモデルとして利用

🚀 Light-R1-7B-DS: わずか3Kのデータで構築されたSOTAの7B数学モデル

Light-R1-7B-DSは、私たちの知る限りでは、AIME24とAIME25のスコアがそれぞれ59.1と44.3で、最先端のオープンソースの7B数学モデルです。また、Light-R1-7B-DSは、特定の訓練を行わずにGPQAでも良好な性能を発揮しています。このモデルはDeepSeek-R1-Distill-Qwen-7Bをベースに、公開した3KのSFTデータのみでさらに訓練されており、公開データの強力な適用性を示しています。

📦 モデル情報

プロパティ	詳細
ベースモデル	deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
ライセンス	apache-2.0
パイプラインタグ	text-generation
ライブラリ名	transformers

📊 モデル比較

モデル	訓練元	リリース日	AIME24	AIME25	GPQA
OpenThinker-7B	Qwen2.5-7B-Instruct	25.2.12	31.3	N/A	42.4
DeepSeek-R1-Distill-Qwen-7B	Qwen2.5-Math-7B	25.1.20	55.5	39.2	49.1
Light-R1-7B-DS (当社製) 🤗	DeepSeek-R1-Distill-Qwen-7B	25.3.12	59.1	44.3	49.4
Light-R1-32B (当社製) 🤗	Qwen2.5-32B-Instruct	25.3.4	76.6	64.6	61.8

技術レポート

GitHubページ

💻 使用例

基本的な使用法

Light-R1-7B-DSの使用方法はDeepSeek-R1-Distill-Qwen-7Bと同じです。

🔧 データの汚染対策

私たちはいくつかのオープンソースデータセットのデータ汚染を慎重に評価しました。事前学習中にはある程度の汚染は避けられないかもしれませんが、事後学習でベンチマークを比較する際には許容できません。MATH-500には数十の問題が同一または数値のみが変更されており、多少の影響を受けています。AIME 24と25は無傷ですが、2023年までのAIMEデータを組み込む際には特別な注意が必要です。Light-R1では、完全一致（数字を除く）とN-gram（N = 32）の一致による徹底的な汚染対策を行っています。

📄 引用

@misc{lightr1proj,
      title={Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond}, 
      author={Liang Wen, Yunke Cai, Fenrui Xiao, Xin He, Qi An, Zhenyu Duan, Yimin Du, Junchen Liu, Lifu Tang, Xiaowei Lv, Haosheng Zou, Yongchao Deng, Shousheng Jia, Xiangzheng Zhang},
      year={2025},
      eprint={},
      archivePrefix={},
      url={https://github.com/Qihoo360/Light-R1}, 
}