N

Nuke X Gemma3 1B Reasoner Testing

由NuclearAi開發
基於Google Gemma-3-1B優化的推理增強模型,通過GRPO算法和高質量數據集提升邏輯推理能力
下載量 77
發布時間 : 3/31/2025

模型概述

該模型是針對Gemma-3-1B的優化版本,專注於提升文本生成和邏輯推理能力,適用於對話式AI場景

模型特點

推理能力增強
通過GRPO算法和專用訓練數據集顯著提升原版Gemma的推理能力
高效微調
僅使用150條高質量數據進行5步微調,30分鐘內完成訓練
Unsloth優化
採用Unsloth框架進行高效訓練和推理優化

模型能力

文本生成
邏輯推理
對話式AI
故事創作

使用案例

創意寫作
短篇故事生成
生成符合邏輯的創意短篇故事
如示例中生成的'學會飛行的貓'故事
問答系統
結構化問題解答
提供包含推理過程的詳細解答
模型會先展示思考過程再給出最終答案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase