T

Thinkygemma 4b

由xsanskarx開發
基於Google Gemma-3-4b-pt微調的偽推理專家模型,專為結構化推理/偽誘導推理設計
下載量 19
發布時間 : 3/14/2025

模型概述

該模型是Google Gemma-3-4b-it的微調版本,旨在偽裝成優秀的推理者,專注於結構化推理和偽誘導推理任務。

模型特點

結構化推理能力
專為結構化推理和偽誘導推理設計,能夠生成邏輯連貫的推理過程。
高效微調
使用LoRA微調技術(r = 128, alpha = 256),在單塊NVIDIA H100上僅需9小時完成訓練。
優質訓練數據
基於2.5萬條經過驗證的思維鏈(CoT)軌跡進行訓練,數據來自DeepSeek R1和Qwen QWQ。

模型能力

文本生成
結構化推理
偽誘導推理

使用案例

教育
邏輯推理教學
用於生成邏輯推理示例,幫助學生理解複雜問題的解決過程。
生成連貫的推理鏈條,展示問題解決的逐步過程。
研究
推理能力研究
用於研究AI模型的推理能力和偽推理行為。
提供可分析的推理軌跡,幫助理解模型推理機制。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase