Fairyr1 32B GGUF
Apache-2.0
FairyR1-32Bは北京大学DS-LABが開発した効率的な大規模言語モデルで、DeepSeek-R1-Distill-Qwen-32Bを基に、'蒸留-融合'という革新的なプロセスにより高性能と低コスト推論のバランスを実現しています。
大規模言語モデル
Transformers 英語

F
Mungert
867
1
Fairyr1 32B
Apache-2.0
FairyR1-32Bは、DeepSeek-R1-Distill-Qwen-32Bを基にした効率的な大規模言語モデルで、最適化された蒸留と統合プロセスにより、数学とプログラミングタスクで優れた性能を発揮します。
大規模言語モデル
Transformers 英語

F
PKU-DS-LAB
372
85
DNA R1
DNA-R1はマイクロソフトPhi-4を基に最適化された韓国語専用推論モデルで、強化学習により韓国語推論能力が大幅に向上し、数学、プログラミング、一般的な推論タスクで優れた性能を発揮します。
大規模言語モデル
Transformers 複数言語対応

D
dnotitia
1,943
35
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98