L

Llemma 7b

由EleutherAI開發
Llemma 34B 是一款專注於數學領域的語言模型,基於Code Llama 34B權重初始化,並在Proof-Pile-2數據集上訓練。
下載量 3,668
發布時間 : 9/12/2023

模型概述

Llemma系列模型在思維鏈數學推理以及使用Python和形式化定理證明器等數學計算工具方面表現尤為突出。

模型特點

數學推理能力
在思維鏈數學任務中全面超越Llama-2和Code Llama,性能優於Minerva。
工具使用能力
支持使用Python和形式化定理證明器等數學計算工具。
多數投票策略提升性能
通過多數投票策略可進一步提升模型在數學任務中的表現。

模型能力

數學問題求解
定理證明
數學推理
工具使用(Python、定理證明器)

使用案例

教育
數學問題解答
解答各類數學問題,包括代數、幾何、微積分等。
在GSM8k數據集上達到51.5%的準確率。
數學競賽題目求解
解決數學競賽中的複雜題目。
在MATH數據集上達到25.0%的準確率。
研究
定理證明
輔助數學研究者進行定理證明。
詳見論文中的定理證明評估部分。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase