xgen-small-9B-instruct-r開源語言模型 - 企業級低成本實現長上下文性能

首頁

Xgen Small 9B Instruct R

由Salesforce開發

xGen-small是一款企業級緊湊型語言模型，通過領域聚焦的數據整理、可擴展的預訓練、長度擴展和強化學習微調，以可預測的低成本實現長上下文性能表現。

大型語言模型

Transformers

英語#128k長上下文 #企業級小模型 #強化學習微調

下載量 97

發布時間 : 5/9/2025

模型概述

xGen-small是一款專注於企業應用的小型語言模型，通過優化的訓練流程和強化學習微調，在保持較小參數規模的同時實現了長上下文處理能力。

模型特點

長上下文處理

支持128k tokens的長上下文處理能力

企業級優化

專為企業應用場景設計，平衡性能與成本

強化學習微調

通過強化學習進行指令微調，提升對話和指令跟隨能力

模型能力

長文本理解

對話生成

問答系統

數學推理

編程輔助

使用案例

企業應用

客戶服務對話系統

用於構建企業級客戶服務對話機器人

在對話評估中表現優異

技術文檔分析

處理和分析長技術文檔

得益於128k上下文長度支持

教育與研究

數學問題解答

解決複雜的數學和科學問題

在GSM8K和MATH等數學基準測試中表現優異

🚀 xGen-small家族歡迎您！

xGen-small (博客, arXiv) 是一款適用於企業的緊湊型大語言模型，它結合了領域聚焦的數據篩選、可擴展的預訓練、長度擴展和強化學習微調等技術，能夠以可預測的低成本實現長上下文處理能力。 本次模型發佈僅用於研究目的。

✨ 主要特性

模型系列

xGen-small 有兩種規模（40億和90億參數）和兩種變體（預訓練和後訓練）：

模型	總參數數量	上下文長度	變體	下載鏈接
salesforce/xgen-small-4B-base-r	40億	128k	預訓練	🤖 鏈接
salesforce/xgen-small-4B-instruct-r	40億	128k	後訓練	🤖 鏈接
salesforce/xgen-small-9B-base-r	90億	128k	預訓練	🤖 鏈接
salesforce/xgen-small-9B-instruct-r	90億	128k	後訓練	🤖 鏈接

💻 使用示例

基礎用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Salesforce/xgen-small-9B-instruct-r"
tokenizer = AutoTokenizer.from_pretrained(model_name)
device = "cuda" if torch.cuda.is_available() else "cpu"
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto"
).to(device)

prompt = "What is Salesforce?"
messages = [{"role": "user", "content": prompt}]
inputs = tokenizer.apply_chat_template(
    messages,
    add_generation_prompt=True,
    return_tensors="pt"
).to(model.device)

generated = model.generate(inputs, max_new_tokens=128)
output = tokenizer.decode(
    generated[0],
    skip_special_tokens=True,
)
print(output)

🔧 技術細節

評估結果

類別	任務	Llama 3.1-8B	Granite 3.3-8B	Qwen2.5-7B	xGen-small 9B Instruct
常識與推理	MMLU	68.3	62.7	72.4	72.4
常識與推理	MMLU-Pro	43.2	43.5	56.7	57.3
對話	Arena-Hard-v1.0	28.9	30.5	48.1	60.1
對話	MT-Bench	8.25	8.57	8.56	8.90
數學與科學	GPQA	31.9	35.3	32.6	45.8
數學與科學	GSM8K	84.2	89.4	91.9	95.3
數學與科學	MATH	48.9	70.9	74.6	91.6
數學與科學	AIME 2024	6.7	10.0	6.7	50.0
編程	HumanEval+	61.6	65.9	74.4	78.7
編程	MBPP+	55.3	60.3	68.8	63.8
編程	LiveCodeBench	10.3	10.3	12.1	50.6

引用信息

@misc{xgensmall,
      title={xGen-small Technical Report}, 
      author={Erik Nijkamp and Bo Pang and Egor Pakhomov and Akash Gokul and Jin Qu and Silvio Savarese and Yingbo Zhou and Caiming Xiong},
      year={2025},
      eprint={2505.06496},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2505.06496}, 
}

📄 許可證

⚠️ 重要提示

本次發佈僅用於支持學術論文的研究目的。我們的模型、數據集和代碼並非專門為所有下游應用而設計或評估。我們強烈建議用戶在部署此模型之前，評估並解決與準確性、安全性和公平性相關的潛在問題。我們鼓勵用戶考慮人工智能的常見侷限性，遵守適用法律，並在選擇用例時採用最佳實踐，特別是在高風險場景中，錯誤或濫用可能會對人們的生活、權利或安全產生重大影響。有關用例的更多指導，請參考我們的使用協議和人工智能使用協議。