Fairyr1 32B
F
Fairyr1 32B
PKU-DS-LABによって開発
FairyR1-32Bは、DeepSeek-R1-Distill-Qwen-32Bを基にした効率的な大規模言語モデルで、最適化された蒸留と統合プロセスにより、数学とプログラミングタスクで優れた性能を発揮します。
ダウンロード数 372
リリース時間 : 5/23/2025
モデル概要
FairyR1-32Bは数学とプログラミングタスクに特化した効率的な言語モデルで、タスク指向の微調整とモデル統合技術により、モデル規模と推論コストを大幅に削減しながら高性能を維持しています。
モデル特徴
効率的な性能
約5%のパラメータのみを使用しながら、数学とプログラミングタスクで大規模モデルと同等以上の性能を発揮。
最適化された蒸留プロセス
多段階のデータ選別と再構築により、高品質な訓練サンプルを精選し、モデル性能を向上。
モデル統合技術
AcreeFusionツールを使用して複数の専門家モデルを統合し、アーキテクチャを簡素化してコストを削減。
モデル能力
数学問題解答
コード生成
科学質問応答
テキスト生成
使用事例
教育
数学競技問題解答
AIMEなどの数学競技問題を解答し、詳細な解法ステップを提供。
AIME 2024および2025テストで優れた成績。
プログラミング
コード生成と最適化
様々なプログラミング言語に対応したコード生成と最適化。
LiveCodeBenchテストで同類モデルを上回る性能。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98