M

Marco O1

AIDC-AIによって開発
Marco-o1はオープンエンドな解決策に特化した推論モデルで、思考連鎖のファインチューニング、モンテカルロ木探索、反省メカニズムにより複雑な問題解決能力を強化しています。
ダウンロード数 5,007
リリース時間 : 11/13/2024

モデル概要

Marco-o1大規模言語モデルは、思考連鎖のファインチューニング、モンテカルロ木探索(MCTS)、反省メカニズム、革新的な推論戦略の最適化を通じて、特に明確な正解がないオープンエンドな問題に焦点を当てた複雑な現実問題解決タスクのために設計されています。

モデル特徴

思考連鎖ファインチューニング
オープンソースCoTデータセットと独自開発の合成データを用いた全パラメータファインチューニングにより、Marco-o1-CoTモデルを構築
MCTSによる解空間拡張
LLMとモンテカルロ木探索(Marco-o1-MCTS)を融合し、モデルの信頼度を活用して探索をガイド
推論アクション戦略
MCTSフレームワーク内でのマルチグレインアクション探索とモデル自己反省を含む推論アクション戦略と反省メカニズムを実装
多言語アプリケーション
大規模推論モデルを機械翻訳タスクに初めて適用し、多言語領域における推論スケーリング法則を探索

モデル能力

複雑問題推論
数学問題解決
プログラミング問題解決
多言語翻訳
オープンエンド問題解答

使用事例

教育
数学問題解決
複数ステップの推論を必要とする数学問題を解決
MGSMデータセットで精度6.17%向上
プログラミング
アルゴリズム問題解決
創造的思考を必要とするプログラミング課題を解決
翻訳
スラング翻訳
口語表現を正確に翻訳
例:'踩屎感'を'comfortable sole'と翻訳
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase