モデル選定

数学的推論強化

# 数学的推論強化

Qwen3-4Bは通義千問シリーズ最新世代の40億パラメータ大規模言語モデルで、思考モードと非思考モードの切り替えをサポートし、強力な推論、指示追従、インテリジェントエージェント能力を備えています。

大規模言語モデル

Qwq Bakeneko 32b

Qwen2.5-32BとQwQ-32Bを統合・最適化した日本語対話モデルで、Chat VectorとORPO技術により指示追従能力を強化

大規模言語モデル

Transformers 日本語

Sombrero QwQ 32B Elite11

QwenのQwQ 32Bアーキテクチャを基に最適化された大規模言語モデルで、効率的なメモリ利用、プログラミング支援、複雑な問題解決に特化しています。

大規模言語モデル

Transformers 英語

Li 14b V0.4 Slerp0.1

これはSLERP手法を用いて統合された140億パラメータ規模の大規模言語モデルで、li-14b-v0.4とmiscii-14b-0218の2つの基本モデルを統合して作成されました。

大規模言語モデル

Phi 4 Model Stock V2

Phi-4-Model-Stock-v2は複数のPhi-4バリエーションモデルを統合した大規模言語モデルで、model_stock統合手法を採用し、複数のベンチマークテストで良好な性能を示しています。

大規模言語モデル

Aceinstruct 72B

AceInstructは、Qwenを改良した一連の高度なSFTモデルで、コーディング、数学、汎用タスクに適しています。

大規模言語モデル

Safetensors 複数言語対応

Sky T1 32B Preview GGUF

Sky-T1-32B-Previewは32Bパラメータの大規模言語モデルで、llama.cppのimatrix量子化処理を経ており、テキスト生成タスクに適しています。

大規模言語モデル英語

Dolphin3.0 Llama3.2 3B GGUF

Llama3.2アーキテクチャに基づく3Bパラメータの大規模言語モデルで、英文テキスト生成タスクをサポートし、llama.cppを使用したimatrix量子化を採用

大規模言語モデル英語

LuxLlamaはMeta-Llama-3.1-8B-Instructモデルをファインチューニングしたバージョンで、ルクセンブルク語の理解と生成能力、および一般的および数学的推論能力を特に最適化しています。

大規模言語モデル

Transformers 複数言語対応

Deepseek Coder V2 Lite Base AWQ

DeepSeek-Coder-V2はオープンソースの混合専門家（MoE）コード言語モデルで、特定のコードタスクではGPT4-Turboに匹敵する性能を実現します。

大規模言語モデル

Qwen2 7B Instruct

Qwen2-7B-Instructを基にさらにファインチューニングされたモデルで、複雑なマルチターンツール/関数呼び出しタスクの処理に優れています。

大規模言語モデル

Transformers 複数言語対応

Granite 8b Code Instruct 4k

Granite-8B-Code-Instruct-4Kは80億パラメータのコード命令モデルで、Granite-8B-Code-Base-4Kを基に、さまざまな許可された命令データで微調整されており、論理的推論や問題解決スキルを含む命令遵守能力が強化されています。

大規模言語モデル

Transformers その他

Granite 3b Code Instruct 2k

Granite-3B-Code-Instruct-2KはGranite-3B-Code-Base-2Kを微調整した30億パラメータのモデルで、命令追従能力が強化されており、特にコード生成と論理的推論タスクに優れています。

大規模言語モデル

Transformers その他

Chicka Mixtral 3x7b

3つのMistralアーキテクチャモデルに基づくエキスパート混合大規模言語モデルで、対話、コード、数学タスクに優れています

大規模言語モデル

平均スコア80%を初めて突破したオープンソース大規模言語モデル。MoMo-72B-lora-1.8.7-DPOを微調整し、革新的なDPO-Positive技術で選好学習を最適化

大規模言語モデル

jondurbin/bagel-34b-v0.2をファインチューニングした大規模言語モデルで、新たなDPO-Positive（DPOP）技術を用いて選好学習を最適化

大規模言語モデル

Discolm Mixtral 8x7b V2

Mistral AIのMixtral 8x7bをベースに開発された実験的な8x7b混合エキスパートモデルで、Synthia、MetaMathQA、Capybaraデータセットでファインチューニングされています

大規模言語モデル

Transformers 英語

Wizardlm 13B V1.2

WizardLM-13B V1.2はLlama-2 13bをベースに訓練された大規模言語モデルで、複雑な指令の遵守能力に特化しています。

大規模言語モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase