OpenThinker3-7B-GGUFオープンソースAIモデル - 効率的な推論で、数学、コード、科学の難題を解決

Openthinker3 7B GGUF

QuantFactoryによって開発

OpenThinker3-7B-GGUF は open-thoughts/OpenThinker3-7B の定量化バージョンで、効率的な推論のために最適化されており、Qwen/Qwen2.5-7B-Instruct をベースに微調整され、数学、コード、科学の問題で優れた性能を発揮します。

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #数学推理 #コード生成 #科学質問応答

ダウンロード数 114

リリース時間 : 6/14/2025

モデル概要

これは Qwen/Qwen2.5-7B-Instruct をベースに微調整された 7B パラメータの推論モデルで、数学、コード、科学の問題の解決に特化しており、複数の評価指標で同類の 7B モデルを上回っています。

モデル特徴

効率的な推論最適化

llama.cpp を使用した定量化により、推論性能が大幅に向上します。

強力な推論能力

数学、コード、科学の問題で優れた性能を発揮し、複数の同類の 7B モデルを上回っています。

豊富なデータセットでの学習

OpenThoughts3-1.2M データセットをベースに学習されており、850,000 の数学問題、250,000 のコード問題、100,000 の科学問題が含まれています。

効率的な学習

512 個の A100 ノードを使用して 48 時間の学習を行いました。

モデル能力

数学問題の解答

コードの生成と分析

科学問題の解答

複雑な推論タスクの処理

使用事例

教育

数学問題の解答

様々な数学コンテストの問題を解きます。

AIME、AMC などの数学コンテストの問題で優れた性能を発揮します。

プログラミング教育

学生がプログラミングの問題を理解し解決するのを支援します。

CodeForces などのプログラミングコンテストの問題で良好な性能を発揮します。

科研

科学問題の解答

研究者が基礎科学の問題を解決するのを支援します。

GPQA などの科学評価で良好な性能を発揮します。

🚀 QuantFactory/OpenThinker3-7B-GGUF

このモデルは、open-thoughts/OpenThinker3-7B を llama.cpp を使用して量子化したバージョンです。

📚 詳細ドキュメント

オリジナルモデルカード

論文 | データセット | モデル

⚠️ 重要提示

OpenThoughtsに関する論文を公開しました！こちらで論文をご覧いただけます。

OpenThinker3-7B

最先端のオープンデータ7B推論モデルです。

このモデルは、Qwen/Qwen2.5-7B-Instruct を OpenThoughts3-1.2M データセットでファインチューニングしたものです。以前のモデルである OpenThinker-7B と OpenThinker2-7B よりも著しく改善されており、DeepSeek-R1-Distill-Qwen-7B や Llama-3.1-Nemotron-Nano-8B-v1 などの他の強力な推論7Bモデルを上回っています。これは、SFTのみでトレーニングされ、RLは使用されていないにもかかわらずです。

今回は論文も公開しました！詳細については、論文とブログ記事をご覧ください。OpenThinker3-32Bも近日公開予定です！

評価結果

以下の表に報告されている数値は、オープンソースツール Evalchemy で評価されたものです。表では、各列で最良値の2標準誤差以内の値を太字で表示しています。

モデル	データ	AIME24	AIME25	AMC23	MATH500	HMMT O2/25	LCB 06/24-01/25	CodeElo	CodeForces	GPQA-D	JEEBench
OpenThinker-7B	‚úÖ	30.7	22.0	72.5	82.8	15.7	26.1	11.1	14.9	38.6	45.3
OpenThinker2-7B	‚úÖ	60.7	38.7	89.8	87.6	24.7	40.6	22.8	26.6	47.0	65.1
OpenThinker3-7B	‚úÖ	69.0	53.3	93.5	90.0	42.7	51.7	31.0	32.2	53.7	72.4
DeepSeek-R1-Distill-Qwen-32B	‚ùå	51.3	38.0	92.0	88.0	25.0	34.5	19.9	21.1	33.2	50.4
OpenR1-Distill-7B	‚úÖ	57.7	39.7	87.0	88.0	25.7	30.7	30.1	29.3	58.9	68.7
Llama-3.1-Nemotron-Nano-8B-v1	‚úÖ	62.0	48.0	94.0	89.4	26.7	50.9	30.9	32.9	52.9	70.7
AceReason-Nemotron-7B	‚úÖ	71.0	50.7	93.8	89.8	33.3	44.3	32.9	30.9	52.9	64.3

データ

このモデルは、OpenThoughts3-1.2M データセットでトレーニングされました。

強力なモデル性能の鍵は、包括的なデータパイプラインと1000以上のアブレーション実験です。これにより、OpenThoughts3-1.2M が作成されました。これは、850,000の数学問題、250,000のコード問題、および100,000の科学問題から構成されています。推論トレースはQwQ-32Bで生成されています。

詳細情報については、OpenThoughts3-1.2M データセットページまたは論文を参照してください。

想定用途と制限

このモデルはApache 2.0ライセンスの下で提供されています。

トレーニング手順

このモデルは、512台のA100ノードを使用して48時間トレーニングされました。

トレーニングハイパーパラメータ

トレーニング中に使用されたハイパーパラメータは以下の通りです。

learning_rate: 8e-05
seed: 42
distributed_type: multi-GPU
num_devices: 512
gradient_accumulation_steps: 1
total_train_batch_size: 512
optimizer: OptimizerNames.ADAMW_TORCHを使用し、betas=(0.9,0.999)、epsilon=1e-08、optimizer_args=追加のオプティマイザ引数なし
lr_scheduler_type: cosine
lr_scheduler_warmup_ratio: 0.1
num_epochs: 5.0
weight_decay: 0.0

フレームワークバージョン

Transformers 4.46.1
Pytorch 2.3.0
Datasets 3.1.0
Tokenizers 0.20.3

詳細情報は、リポジトリ https://github.com/open-thoughts/open-thoughts で確認できます。

リンク

引用

@misc{guha2025openthoughtsdatarecipesreasoning,
  title={OpenThoughts: Data Recipes for Reasoning Models}, 
  author={Etash Guha and Ryan Marten and Sedrick Keh and Negin Raoof and Georgios Smyrnis and Hritik Bansal and Marianna Nezhurina and Jean Mercat and Trung Vu and Zayne Sprague and Ashima Suvarna and Benjamin Feuer and Liangyu Chen and Zaid Khan and Eric Frankel and Sachin Grover and Caroline Choi and Niklas Muennighoff and Shiye Su and Wanjia Zhao and John Yang and Shreyas Pimpalgaonkar and Kartik Sharma and Charlie Cheng-Jie Ji and Yichuan Deng and Sarah Pratt and Vivek Ramanujan and Jon Saad-Falcon and Jeffrey Li and Achal Dave and Alon Albalak and Kushal Arora and Blake Wulfe and Chinmay Hegde and Greg Durrett and Sewoong Oh and Mohit Bansal and Saadia Gabriel and Aditya Grover and Kai-Wei Chang and Vaishaal Shankar and Aaron Gokaslan and Mike A. Merrill and Tatsunori Hashimoto and Yejin Choi and Jenia Jitsev and Reinhard Heckel and Maheswaran Sathiamoorthy and Alexandros G. Dimakis and Ludwig Schmidt},
  year={2025},
  eprint={2506.04178},
  archivePrefix={arXiv},
  primaryClass={cs.LG},
  url={https://arxiv.org/abs/2506.04178}, 
}

情報テーブル

属性	詳情
ベースモデル	Qwen/Qwen2.5-7B-Instruct
データセット	open-thoughts/OpenThoughts3-1.2M
ライブラリ名	transformers
ライセンス	apache-2.0
タグ	llama-factory, full, generated_from_trainer
パイプラインタグ	text-generation