C

Codellama 7b Hf ReFT GSM8k

由lqtrung1998開發
通過強化微調增強大語言模型的推理泛化能力,基於Codellama微調,適用於代碼生成與理解任務。
下載量 38
發布時間 : 1/29/2024

模型概述

ReFT方法通過強化微調提升大語言模型在數學推理任務上的表現,特別針對GSM8k數學問題數據集優化。

模型特點

強化微調
通過強化學習優化模型在數學推理任務上的表現
Python SDP思維鏈
使用Python結構化思維鏈格式訓練模型
重排序機制
配備專門的重排序模型評估輸出思維鏈的正確性

模型能力

數學問題求解
Python代碼生成
結構化推理
思維鏈生成

使用案例

教育
數學問題解答
解決GSM8k數據集中的數學應用題
在GSM8k測試集上達到81.2%準確率
編程輔助
代碼生成
根據數學問題描述生成Python解決方案代碼
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase