A

AM Thinking V1

a-m-teamによって開発
推論能力を強化した320億パラメータの密言語モデルで、Qwen 2.5‑32B‑Baseを基に構築されており、推論ベンチマークではより大規模なMoEモデルに匹敵する性能を発揮します。
ダウンロード数 1,377
リリース時間 : 5/10/2025

モデル概要

AM-Thinking-v1は320億パラメータの密言語モデルで、推論能力の強化に焦点を当て、Qwen 2.5‑32B‑Baseを基に構築され、精巧に設計されたトレーニングプロセスによりフラッグシップレベルの推論能力を実現しています。

モデル特徴

高性能推論能力
推論ベンチマークではDeepSeek‑R1、Qwen3‑235B‑A22Bなどのより大規模なMoEモデルに匹敵する性能を示します。
シングルGPUデプロイ
単一のA100-80GB GPUでデプロイ可能で、決定論的な遅延があり、MoEルーティングのオーバーヘッドが不要です。
オープンソースコンポーネント構築
Qwen 2.5‑32B‑Baseや強化学習トレーニングデータを含め、完全にオープンソースコンポーネントで構築されています。
精巧に設計されたトレーニングプロセス
教師あり微調整+二段階強化学習のトレーニングプロセスにより、フラッグシップレベルの推論能力を実現しています。

モデル能力

テキスト生成
複雑な推論
コード生成

使用事例

推論タスク
数学的推論
複雑な数学的問題を解決
AIME’24/’25ベンチマークで優れた成績
コード生成
高品質なコードを生成
LiveCodeBenchでDeepSeek‑R1を上回る
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase