モデル選定

強化学習推論

# 強化学習推論

Acereason Nemotron 14B GGUF

強化学習で訓練された数学とプログラミング推論モデルで、複数のベンチマークテストで優れた性能を発揮

大規模言語モデル

Transformers 英語

Seed Coder 8B Reasoning GGUF

Seed-Coder-8B-Reasoningは8B規模のオープンソースコードモデルで、コード生成と推論タスクに特化しており、強力な性能と効率的なパラメータ利用を備えています。

大規模言語モデル

Seed Coder 8B Instruct

Seed-Coder-8B-Instructは8B規模のオープンソースコードモデルで、ユーザーの意図に合わせるために命令微調整されており、32Kのコンテキスト長をサポートしています。

大規模言語モデル

Open Reasoner Zero 7B

オープンリーズナーゼロは、基礎モデルのスケーラブルな強化学習に焦点を当てたオープンソースソリューションで、拡張性、簡潔性、使いやすさを重視した大規模推論指向の強化学習実装です。

大規模言語モデル

Open-Reasoner-Zero

Deepseek R1 Distill Qwen 32B Unsloth Bnb 4bit

DeepSeek-R1はDeepSeekチームによって開発された初代推論モデルで、大規模な強化学習トレーニングを通じて、教師付き微調整（SFT）を最初のステップとせずに、卓越した推論能力を発揮します。

大規模言語モデル

Transformers 英語

Deepseek R1 Zero

DeepSeek-R1はDeepSeekが開発した第一世代推論モデルで、強化学習によって訓練され、数学、コード、推論タスクで優れた性能を発揮します。

大規模言語モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase