Acemath RL Nemotron 7B GGUF
その他
AceMath-RL-Nemotron-7Bは、完全に強化学習によって訓練された数学的推論モデルです。Deepseek-R1-Distilled-Qwen-7Bをベースに訓練され、数学的推論タスクで優れた性能を発揮し、同時にコーディングタスクにも一定の汎化能力を持っています。
大規模言語モデル
Transformers 英語

A
Mungert
633
1
Gemma 3 12B FornaxV.2 QAT CoT Q4 0 GGUF
これは8GiBのコンシューマー向けGPUで動作することを目的とした実験的な小型思考モデルで、汎用推論能力を備えています。教師あり微調整(SFT)と高品質な推論軌跡トレーニングにより、モデルは推論能力を様々なタスクに汎化できます。
大規模言語モデル
G
ConicCat
98
1
GLM 4 9B 0414 GGUF
MIT
GLM-4-9B-0414はGLMファミリーの軽量メンバーで、90億のパラメータを持ち、数学的推論と汎用タスクで優れたパフォーマンスを発揮し、リソースが制限されたシナリオに効率的なソリューションを提供します。
大規模言語モデル 複数言語対応
G
unsloth
4,291
9
T0 3B
Apache-2.0
T0++はT5アーキテクチャに基づく自然言語処理モデルで、マルチタスクプロンプトトレーニングによりゼロショットタスク汎化能力を実現し、多くのNLPタスクでGPT-3を上回りながらよりコンパクトです。
大規模言語モデル
Transformers 英語

T
bigscience
3,723
100
Llama 3.1 MIG Tulu 3 8B SFT
Apache-2.0
自動フィルタリングされた5万件のTulu-3-MIGデータセットでファインチューニングされたLlama-3.1-8Bモデル
大規模言語モデル
Transformers

L
xsample
26
3
Lwm
LWMは無線通信分野初の基盤モデルで、汎用特徴抽出器として開発され、無線チャネルデータから精緻な表現を抽出できます。
物理学モデル
Transformers

L
wi-lab
137
3
Robustsam Vit Large
MIT
RobustSAMは劣化画像においてロバストに任意のオブジェクトをセグメントするモデルで、SAMを改良し、低品質画像でのセグメンテーション性能を向上させています。
画像セグメンテーション
Transformers その他

R
jadechoghari
86
4
Llama 3 Gutenberg 8B
その他
Llama-3-8bベースのファインチューニングモデルで、Gutenberg DPOデータセットを使用して最適化されており、テキスト生成タスクに適しています。
大規模言語モデル
Transformers

L
nbeerbower
18
9
Roberta Large Zeroshot V2.0 C
MIT
効率的なゼロショット分類のために設計されたRoBERTa-largeモデルで、ビジネスフレンドリーデータで訓練されており、訓練データなしでテキスト分類タスクを実行可能です。
テキスト分類
Transformers 英語

R
MoritzLaurer
53
2
Psyfighter 13B
これはLlama-2-13Bをベースとしたハイブリッドモデルで、Tiefighter、MedLLaMA、limarp-v2など複数モデルの特徴を統合し、様々なテキスト生成タスクに適しています。
大規模言語モデル
Transformers

P
jebcarter
86
12
Wizardlm 13B V1.2
WizardLM-13B V1.2はLlama-2 13bをベースに訓練された大規模言語モデルで、複雑な指令の遵守能力に特化しています。
大規模言語モデル
Transformers

W
WizardLMTeam
989
226
Hh Rlhf Rm Open Llama 3b
LMFlowフレームワークに基づいて訓練された報酬モデルで、HH - RLHFデータセット(有用な部分のみ)を対象とし、open_llama_3bをベースモデルとして訓練され、良好な汎化能力を持っています。
大規模言語モデル
Transformers

H
weqweasdas
483
18
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98