Nova-0.5-e3-7B開源文本生成模型 - 免費使用，數學推理表現超棒！

首頁

Nova 0.5 E3 7B

由oscar128372開發

Nova 0.5 e3是一個7B參數的文本生成模型，展現出令人驚異的湧現特性，特別是在數學推理方面表現出色。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #數學推理 #自動推導 #多步解題

下載量 90

發布時間 : 3/24/2025

模型概述

該模型基於千問2架構，經過強化學習監督微調，展現出邏輯推理能力，能解決複雜數學問題。

模型特點

湧現推理能力

模型在處理複雜問題時能自動觸發推理模式，展示出多步邏輯推理能力

意外訓練效果

由於訓練數據中意外混入推理訓練集，模型獲得了超出預期的推理能力

嚴格使用要求

必須使用ChatML對話模板，且禁止4bit量化加載以保持推理能力

模型能力

文本生成

數學問題求解

邏輯推理

多步問題解答

使用案例

教育

數學問題求解

解決代數方程等數學問題

能正確解答如x^2 + x = 8等二次方程

研究

推理能力研究

研究語言模型的湧現推理能力

展示了模型意外獲得的推理能力

🚀 Nova 0.5 e3

Nova 0.5 e3是一個文本生成模型，它展現出了有趣的推理能力，在處理複雜問題時能給出合理的解答。

🚀 快速開始

運行模型的基本示例

以下是使用Python和Hugging Face的transformers庫加載並運行Nova 0.5 e3的基本示例。請確保你已安裝所需的依賴項（如transformers、torch等）。

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 從Hugging Face加載分詞器和模型
model_name = "oscar128372/Nova-0.5-e3-7B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# 若有可用的GPU則移至GPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

# 設置ChatML提示模板
chatml_prompt = """
<|im_start|>system
{}<|im_end|>
<|im_start|>user
{}<|im_end|>
<|im_start|>assistant
"""

# 示例系統提示
system_prompt = "You are a helpful assistant."

# 示例提示
prompt = "Solve x^2 + x = 8."

# 對輸入進行分詞
inputs = tokenizer(
[
    chatml_prompt.format(
      system_prompt,
      prompt
    )
], return_tensors="pt").to(device)

# 生成響應
outputs = model.generate(
    **inputs,
    max_length=1024,  # 對於推理任務，保持此值較高；否則，保持較低。
)

# 解碼並打印結果
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

# 預期輸出：經過推理的解決方案，例如 "x = (-1 ± √33)/2"

✨ 主要特性

該模型具有以下有趣的特性：

推理能力：當被問到像“4 x 2等於多少？”這樣簡單的問題時，它能直接給出答案“8”。而對於更復雜的問題，如求解方程“x^2 + x = 8”，它會開始進行推理並正確解答。

<|begin_of_thought|>
**分析**：
該方程是標準形式的二次方程 \(x^2 + x - 8 = 0\)。直接因式分解似乎有挑戰，因此嘗試通過配方來求解。

**第一步**：
在方程兩邊同時加1：
\(x^2 + x + 1 = 9\)。

**第二步**：
認識到 \(x^2 + x + 1\) 可以寫成 \((x + \frac{1}{2})^2 - (\frac{1}{2})^2 + 1\)，化簡為 \((x + \frac{1}{2})^2 - \frac{1}{4} + 1 = (x + \frac{1}{2})^2 + \frac{3}{4}\)。

**下一步**：
令其等於9：
\((x + \frac{1}{2})^2 + \frac{3}{4} = 9\)。

**反思**：
在方程兩邊同時減去 \(\frac{3}{4}\)：
\((x + \frac{1}{2})^2 = 9 - \frac{3}{4} = \frac{36}{4} - \frac{3}{4} = \frac{33}{4}\)。

**最後**：
對方程兩邊取平方根：
\(x + \frac{1}{2} = \pm \sqrt{\frac{33}{4}} = \pm \frac{\sqrt{33}}{2}\)。

**總結**：
求解 \(x\)：
\(x = -\frac{1}{2} \pm \frac{\sqrt{33}}{2} = \frac{-1 \pm \sqrt{33}}{2}\)。
解為：
\(\boxed{\frac{-1 + \sqrt{33}}{2}, \frac{-1 - \sqrt{33}}{2}}\)。
<|end_of_thought|>

<|begin_of_solution|>
**解決方案**：
從 \(x^2 + x = 8\) 開始，將其重寫為 \(x^2 + x + 1 = 9\)。對左邊進行配方：

1. 將 \(x^2 + x + 1\) 重寫為 \((x + \frac{1}{2})^2 - (\frac{1}{2})^2 + 1 = (x + \frac{1}{2})^2 - \frac{1}{4} + 1 = (x + \frac{1}{2})^2 + \frac{3}{4}\)。
2. 令其等於9：\((x + \frac{1}{2})^2 + \frac{3}{4} = 9\)。
3. 減去 \(\frac{3}{4}\)：\((x + \frac{1}{2})^2 = \frac{33}{4}\)。
4. 取平方根：\(x + \frac{1}{2} = \pm \frac{\sqrt{33}}{2}\)。
5. 求解 \(x\)：\(x = -\frac{1}{2} \pm \frac{\sqrt{33}}{2}\)。

因此，解為 \(\boxed{\frac{-1 + \sqrt{33}}{2}, \frac{-1 - \sqrt{33}}{2}}\)。
<|end_of_solution|>

雖然這種推理能力不如[Nova - 0.5 - r1 - 7B](https://huggingface.co/oscar128372/Nova - 0.5 - r1 - 7B)，但仍展現出了潛力。

🔧 技術細節

該模型推理能力的獲得純屬意外。在訓練時，不小心將一個推理數據集與其他較簡單的數據集混合在一起。結果發現，這個推理數據集教會了模型僅在處理更復雜、多步驟的提示時進行推理。

📄 許可證

本模型採用Apache - 2.0許可證。

⚠️ 重要提示

加載方式

不能以4位精度加載該模型。以4位精度加載會完全消除模型的推理能力，使其變成一個普通的基礎模型。如果你不希望模型進行推理，那麼以4位精度加載或許可行，但具體原因尚不明確。

提示模板

使用ChatML模板：

<|im_start|>system
{}<|im_end|>
<|im_start|>user
{}<|im_end|>
<|im_start|>assistant
{}

⚠️ 重要提示

我僅使用了 “You are a helpful assistant.” 系統提示對模型進行了測試，因此其他系統提示可能會產生不正確或意外的結果。

📚 詳細文檔

未來規劃

未來不會有e4版本。下一步計劃是推出1.0版本，也許還會有1.0 - r1版本。請關注未來可能出現的新推理模型。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫