G

GLM Z1 Rumination 32B 0414

由THUDM開發
GLM-Z1-Rumination-32B-0414是一款具備反芻能力的深度推理模型,基於320億參數的GLM-4-32B-0414開發,專注於解決開放和複雜問題。
下載量 1,359
發布時間 : 4/13/2025

模型概述

該模型通過長時間的深度思考和整合搜索工具處理複雜任務,特別擅長研究式寫作和複雜檢索任務。

模型特點

深度思考能力
通過冷啟動和擴展強化學習訓練,顯著提升數學能力和複雜任務解決能力。
反芻能力
通過更長時間的深度思考解決開放和複雜問題,整合搜索工具處理複雜任務。
多規則獎勵引導
利用多規則獎勵引導和擴展端到端強化學習進行訓練,提升模型性能。

模型能力

文本生成
數學推理
複雜任務解決
研究式寫作
複雜檢索
函數調用

使用案例

學術研究
城市AI發展對比分析
撰寫兩座城市AI發展對比分析及其未來發展計劃。
在研究式寫作和複雜檢索任務上表現出顯著提升。
工程代碼
代碼生成
生成工程代碼和函數調用。
在工程代碼和函數調用方面表現良好。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase