D

Deepseek R1 Distill Llama 3B

suayptalhaによって開発
DeepSeek-R1-Distill-Llama-3Bは、Llama-3.2-3Bモデルをベースに、R1-Distill-SFTデータセットを使用してDeepSeek-R1を蒸留したバージョンで、テキスト生成能力を備えています。
ダウンロード数 781
リリース時間 : 2/23/2025

モデル概要

このモデルは、Llama-3.2-3Bモデルを蒸留し、R1-Distill-SFTデータセットを組み合わせて訓練されたもので、主にテキスト生成タスクに使用されます。

モデル特徴

Llama-3.2-3Bをベースとした蒸留
蒸留技術を用いてLlama-3.2-3Bモデルを最適化し、性能を向上させました。
Llama3プロンプトテンプレートをサポート
Llama3のプロンプトテンプレートと互換性があり、ユーザーが使いやすくなっています。
テキスト生成能力
複数のテキスト生成タスクで良好な性能を発揮します。

モデル能力

テキスト生成
推論能力
多輪対話

使用事例

質問応答システム
数値比較
2つの数値の大小を比較し、推論過程を提供します。
モデルは数値を正しく比較し、詳細な推論過程を出力することができます。
教育支援
数学問題の解答
基礎的な数学問題を解き、推論ステップを表示します。
モデルは問題を解き、明確な推論過程を表示することができます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase