モデル選定

思考連鎖最適化

# 思考連鎖最適化

Denker Mistral Nemo 12B

Denkerは、mistral-nemo-kartoffel-12Bを基にORPOとQLoRAでファインチューニングされた、小規模で無検閲の推論特化モデルです。

大規模言語モデル

Qwen3 30B A6B 16 Extreme 128k Context

千問3-30B-A3Bをベースにした混合専門家モデルの微調整版で、活性化専門家数を16に増加、コンテキストウィンドウを128kに拡張し、複雑な推論シナリオに適しています

大規模言語モデル

360zhinao3 7B O1.5

360智脳3-7B-O1.5は奇虎360がオープンソース化した長思考連鎖モデルで、360智脳3-7B-Instructをファインチューニングしており、複雑な推論タスクをサポートします。

大規模言語モデル

Transformers 複数言語対応

MAI-DS-R1はマイクロソフトAIチームがDeepSeek-R1推論モデルに対して追加学習を行った成果であり、センシティブな話題への対応能力を向上させ、リスクパフォーマンスを最適化するとともに、元の推論能力と競争優位性を維持しています。

大規模言語モデル

OpenThoughts-114k-math数学データセット及びその他の思考能力強化トレーニングセットに基づいて構築された高性能推論モデル

大規模言語モデル

Transformers 英語

QwQ-32B-FP8はQwQ-32BモデルのFP8量子化バージョンで、BF16バージョンとほぼ同じ精度を維持しながら、より高速な推論をサポートします。

大規模言語モデル

Deepseek R1 Medical CoT

DeepSeek-R1-Distill-Llama-8Bをファインチューニングした医療思考連鎖推論モデルで、QLoRA量子化技術とUnsloth最適化手法により医療推論能力を強化。

大規模言語モデル

Acemath 7B Instruct

AceMath-7B-InstructはNVIDIAが数学推論専用に設計した指導モデルで、改良版Qwenアーキテクチャに基づいて開発され、思考連鎖(CoT)推論を通じて英語の数学問題を解決するのに優れています。

大規模言語モデル英語

LlamaV-o1は、複雑な視覚的推論タスクのために設計された先進的なマルチモーダル大規模言語モデルで、カリキュラム学習技術によって最適化され、多様なベンチマークテストで卓越した性能を発揮します。

テキスト生成画像英語

Codellama 7b Hf ReFT GSM8k

強化学習による微調整で大規模言語モデルの推論汎化能力を強化、Codellamaをベースに微調整され、コード生成と理解タスクに適しています。

大規模言語モデル

Llemma 34Bは数学分野に特化した言語モデルで、Code Llama 34Bの重みを初期値としてProof-Pile-2データセットで訓練されました。

大規模言語モデル

Transformers 英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase