Denker Mistral Nemo 12B
Apache-2.0
Denkerは、mistral-nemo-kartoffel-12Bを基にORPOとQLoRAでファインチューニングされた、小規模で無検閲の推論特化モデルです。
大規模言語モデル
Transformers

D
nbeerbower
20
2
Qwen3 30B A6B 16 Extreme 128k Context
千問3-30B-A3Bをベースにした混合専門家モデルの微調整版で、活性化専門家数を16に増加、コンテキストウィンドウを128kに拡張し、複雑な推論シナリオに適しています
大規模言語モデル
Transformers

Q
DavidAU
72
7
360zhinao3 7B O1.5
Apache-2.0
360智脳3-7B-O1.5は奇虎360がオープンソース化した長思考連鎖モデルで、360智脳3-7B-Instructをファインチューニングしており、複雑な推論タスクをサポートします。
大規模言語モデル
Transformers 複数言語対応

3
qihoo360
35
3
MAI DS R1 FP8
MIT
MAI-DS-R1はマイクロソフトAIチームがDeepSeek-R1推論モデルに対して追加学習を行った成果であり、センシティブな話題への対応能力を向上させ、リスクパフォーマンスを最適化するとともに、元の推論能力と競争優位性を維持しています。
大規模言語モデル
Transformers

M
microsoft
845
18
Nova 0.5 R1 7B
Apache-2.0
OpenThoughts-114k-math数学データセット及びその他の思考能力強化トレーニングセットに基づいて構築された高性能推論モデル
大規模言語モデル
Transformers 英語

N
oscar128372
18
2
QWQ 32B FP8
Apache-2.0
QwQ-32B-FP8はQwQ-32BモデルのFP8量子化バージョンで、BF16バージョンとほぼ同じ精度を維持しながら、より高速な推論をサポートします。
大規模言語モデル
Transformers

Q
qingcheng-ai
144
6
Deepseek R1 Medical CoT
MIT
DeepSeek-R1-Distill-Llama-8Bをファインチューニングした医療思考連鎖推論モデルで、QLoRA量子化技術とUnsloth最適化手法により医療推論能力を強化。
大規模言語モデル
D
zijiechen156
49
2
Acemath 7B Instruct
AceMath-7B-InstructはNVIDIAが数学推論専用に設計した指導モデルで、改良版Qwenアーキテクチャに基づいて開発され、思考連鎖(CoT)推論を通じて英語の数学問題を解決するのに優れています。
大規模言語モデル 英語
A
nvidia
1,454
22
Llamav O1
Apache-2.0
LlamaV-o1は、複雑な視覚的推論タスクのために設計された先進的なマルチモーダル大規模言語モデルで、カリキュラム学習技術によって最適化され、多様なベンチマークテストで卓越した性能を発揮します。
テキスト生成画像 英語
L
omkarthawakar
1,406
93
Codellama 7b Hf ReFT GSM8k
強化学習による微調整で大規模言語モデルの推論汎化能力を強化、Codellamaをベースに微調整され、コード生成と理解タスクに適しています。
大規模言語モデル
Transformers

C
lqtrung1998
38
1
Llemma 7b
Llemma 34Bは数学分野に特化した言語モデルで、Code Llama 34Bの重みを初期値としてProof-Pile-2データセットで訓練されました。
大規模言語モデル
Transformers 英語

L
EleutherAI
3,668
106
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98