Nova-0.5-e3-7B开源文本生成模型 - 免费使用，数学推理表现超棒！

首页

Nova 0.5 E3 7B

由 oscar128372 开发

Nova 0.5 e3是一个7B参数的文本生成模型，展现出令人惊异的涌现特性，特别是在数学推理方面表现出色。

大型语言模型

Transformers

英语开源协议:Apache-2.0 #数学推理 #自动推导 #多步解题

下载量 90

发布时间 : 3/24/2025

模型简介

该模型基于千问2架构，经过强化学习监督微调，展现出逻辑推理能力，能解决复杂数学问题。

模型特点

涌现推理能力

模型在处理复杂问题时能自动触发推理模式，展示出多步逻辑推理能力

意外训练效果

由于训练数据中意外混入推理训练集，模型获得了超出预期的推理能力

严格使用要求

必须使用ChatML对话模板，且禁止4bit量化加载以保持推理能力

模型能力

文本生成

数学问题求解

逻辑推理

多步问题解答

使用案例

教育

数学问题求解

解决代数方程等数学问题

能正确解答如x^2 + x = 8等二次方程

研究

推理能力研究

研究语言模型的涌现推理能力

展示了模型意外获得的推理能力

🚀 Nova 0.5 e3

Nova 0.5 e3是一个文本生成模型，它展现出了有趣的推理能力，在处理复杂问题时能给出合理的解答。

🚀 快速开始

运行模型的基本示例

以下是使用Python和Hugging Face的transformers库加载并运行Nova 0.5 e3的基本示例。请确保你已安装所需的依赖项（如transformers、torch等）。

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 从Hugging Face加载分词器和模型
model_name = "oscar128372/Nova-0.5-e3-7B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# 若有可用的GPU则移至GPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

# 设置ChatML提示模板
chatml_prompt = """
<|im_start|>system
{}<|im_end|>
<|im_start|>user
{}<|im_end|>
<|im_start|>assistant
"""

# 示例系统提示
system_prompt = "You are a helpful assistant."

# 示例提示
prompt = "Solve x^2 + x = 8."

# 对输入进行分词
inputs = tokenizer(
[
    chatml_prompt.format(
      system_prompt,
      prompt
    )
], return_tensors="pt").to(device)

# 生成响应
outputs = model.generate(
    **inputs,
    max_length=1024,  # 对于推理任务，保持此值较高；否则，保持较低。
)

# 解码并打印结果
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

# 预期输出：经过推理的解决方案，例如 "x = (-1 ± √33)/2"

✨ 主要特性

该模型具有以下有趣的特性：

推理能力：当被问到像“4 x 2等于多少？”这样简单的问题时，它能直接给出答案“8”。而对于更复杂的问题，如求解方程“x^2 + x = 8”，它会开始进行推理并正确解答。

<|begin_of_thought|>
**分析**：
该方程是标准形式的二次方程 \(x^2 + x - 8 = 0\)。直接因式分解似乎有挑战，因此尝试通过配方来求解。

**第一步**：
在方程两边同时加1：
\(x^2 + x + 1 = 9\)。

**第二步**：
认识到 \(x^2 + x + 1\) 可以写成 \((x + \frac{1}{2})^2 - (\frac{1}{2})^2 + 1\)，化简为 \((x + \frac{1}{2})^2 - \frac{1}{4} + 1 = (x + \frac{1}{2})^2 + \frac{3}{4}\)。

**下一步**：
令其等于9：
\((x + \frac{1}{2})^2 + \frac{3}{4} = 9\)。

**反思**：
在方程两边同时减去 \(\frac{3}{4}\)：
\((x + \frac{1}{2})^2 = 9 - \frac{3}{4} = \frac{36}{4} - \frac{3}{4} = \frac{33}{4}\)。

**最后**：
对方程两边取平方根：
\(x + \frac{1}{2} = \pm \sqrt{\frac{33}{4}} = \pm \frac{\sqrt{33}}{2}\)。

**总结**：
求解 \(x\)：
\(x = -\frac{1}{2} \pm \frac{\sqrt{33}}{2} = \frac{-1 \pm \sqrt{33}}{2}\)。
解为：
\(\boxed{\frac{-1 + \sqrt{33}}{2}, \frac{-1 - \sqrt{33}}{2}}\)。
<|end_of_thought|>

<|begin_of_solution|>
**解决方案**：
从 \(x^2 + x = 8\) 开始，将其重写为 \(x^2 + x + 1 = 9\)。对左边进行配方：

1. 将 \(x^2 + x + 1\) 重写为 \((x + \frac{1}{2})^2 - (\frac{1}{2})^2 + 1 = (x + \frac{1}{2})^2 - \frac{1}{4} + 1 = (x + \frac{1}{2})^2 + \frac{3}{4}\)。
2. 令其等于9：\((x + \frac{1}{2})^2 + \frac{3}{4} = 9\)。
3. 减去 \(\frac{3}{4}\)：\((x + \frac{1}{2})^2 = \frac{33}{4}\)。
4. 取平方根：\(x + \frac{1}{2} = \pm \frac{\sqrt{33}}{2}\)。
5. 求解 \(x\)：\(x = -\frac{1}{2} \pm \frac{\sqrt{33}}{2}\)。

因此，解为 \(\boxed{\frac{-1 + \sqrt{33}}{2}, \frac{-1 - \sqrt{33}}{2}}\)。
<|end_of_solution|>

虽然这种推理能力不如[Nova - 0.5 - r1 - 7B](https://huggingface.co/oscar128372/Nova - 0.5 - r1 - 7B)，但仍展现出了潜力。

🔧 技术细节

该模型推理能力的获得纯属意外。在训练时，不小心将一个推理数据集与其他较简单的数据集混合在一起。结果发现，这个推理数据集教会了模型仅在处理更复杂、多步骤的提示时进行推理。

📄 许可证

本模型采用Apache - 2.0许可证。

⚠️ 重要提示

加载方式

不能以4位精度加载该模型。以4位精度加载会完全消除模型的推理能力，使其变成一个普通的基础模型。如果你不希望模型进行推理，那么以4位精度加载或许可行，但具体原因尚不明确。

提示模板

使用ChatML模板：

<|im_start|>system
{}<|im_end|>
<|im_start|>user
{}<|im_end|>
<|im_start|>assistant
{}

⚠️ 重要提示

我仅使用了 “You are a helpful assistant.” 系统提示对模型进行了测试，因此其他系统提示可能会产生不正确或意外的结果。

📚 详细文档

未来规划

未来不会有e4版本。下一步计划是推出1.0版本，也许还会有1.0 - r1版本。请关注未来可能出现的新推理模型。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库