Hunyuan-7B-Instruct-0124開源大語言模型 - 免費部署，長文本處理表現出色！

首頁

Hunyuan 7B Instruct 0124

由tencent開發

混元-7B是騰訊發佈的開源大語言模型，具有256K長文本處理能力和分組查詢注意力機制(GQA)，在中文7B稠密模型中表現優異。

大型語言模型

Transformers

英語開源協議:其他 #256K長文本處理 #中文7B最強 #GQA注意力機制

下載量 590

發布時間 : 1/24/2025

模型概述

混元-7B模型是騰訊開發的大規模語言模型，專注於中文處理能力，在計算資源和性能表現之間取得了良好平衡。

模型特點

256K長文本處理

將長文本處理能力擴展到256K，適合處理長文檔和複雜上下文

分組查詢注意力機制

採用GQA(Grouped Query Attention)機制，提升模型效率

高性能推理

提供vLLM和TensorRT-LLM兩種推理後端選擇，優化推理速度

中文優化

針對中文任務進行了特別優化，在中文基準測試中表現優異

模型能力

文本生成

問答系統

代碼生成

數學推理

知識問答

長文本理解

使用案例

教育

智能輔導

幫助學生解答各類學科問題

在數學推理(GSM8K)測試中達到93.33%準確率

研究

學術論文分析

處理和分析長篇幅學術論文

支持256K上下文長度

商業

智能客服

處理客戶諮詢和問題解答

在中文問答測試中表現優異

🚀 混元-7B模型

混元此次發佈的7B模型，包括混元-7B預訓練模型-0124 和混元-7B指令模型-0124 ，採用了更優的數據分配和訓練方式，性能強勁，在計算資源和性能表現之間取得了良好的平衡。在眾多大語言模型中脫穎而出，是目前最強的中文7B稠密模型之一。

GITHUB

🚀 快速開始

你可以參考 Tencent-Hunyuan-Large 中的內容快速上手。訓練和推理代碼可以使用該GitHub倉庫中提供的版本。

推理框架

本次開源版本為混元-7B模型提供了兩種推理後端選項：廣受歡迎的 vLLM後端和TensorRT-LLM後端。在本次發佈中，我們首先開源了vLLM解決方案，計劃在不久的將來發布TRT-LLM解決方案。

✨ 主要特性

技術優勢介紹

模型

將長文本處理能力擴展到256K，並採用了分組查詢注意力機制（Grouped Query Attention，GQA）。

推理框架

本次開源發佈為混元-7B模型量身定製了兩種推理後端選項，分別是廣受歡迎的 vLLM後端和TensorRT-LLM後端。此次發佈先開源了vLLM解決方案，後續還計劃發佈TRT-LLM解決方案。

訓練框架

混元-7B開源模型完全兼容Hugging Face格式，研究人員和開發者可以使用hf-deepspeed框架對模型進行微調。更多信息請參考：Tencent-Hunyuan-Large。

📚 詳細文檔

基準測試

注意：以下基準測試由TRT-LLM後端進行評估。

混元-7B預訓練模型

評測指標	Qwen2.5-7B	Llama3-8B	OLMO2-7B	混元-7B-V2
MMLU	74.26	66.95	63.7	75.37
MMLU-Pro	46.17	34.04	31	47.54
MMLU-CF	61.01	55.21	52.94	59.62
MMLU-Redux	73.47	66.44	63.74	74.54
BBH	70.4	62.16	38.01	70.77
HellaSwag	75.82	78.24	61.97	80.77
WinoGrande	69.69	73.64	74.43	71.51
PIQA	79.33	80.52	80.63	81.45
SIQA	77.48	61.05	65.2	79.73
NaturalQuestions	31.77	35.43	36.9	33.52
DROP	68.2	60.13	60.8	68.63
ARC-C	91.64	77.59	74.92	91.97
TriviaQA	69.31	78.61	78	74.31
中文簡單問答	30.37	19.4	7.35	30.51
簡單問答	4.98	7.68	4.51	3.73
CMMLU	81.39	50.25	38.79	82.19
C-Eval	81.11	50.4	38.53	82.12
C3	71.77	61.5	54	79.07
GSM8K	82.71	57.54	67.5	93.33
MATH	49.6	18.45	19	62.15
CMATH	84.33	52.83	44	88.5
HumanEval	57.93	35.98	15.24	59.15

混元-7B指令模型

模型	Qwen2.5-7B-Instruct	Llama-3-8B-Instruct	OLMo-2-1124-7B-DPO	混元-7B指令模型
ARC-C	89.83	82.4	-	88.81
BBH	66.24	-	46.6	76.47
CEval	76.82	-	-	81.8
CMMLU	78.55	-	-	82.29
DROP_F1	80.63	-	60.5	82.96
GPQA	36.87	34.6	-	47.98
Gsm8k	80.14	80.6	85.1	90.14
HellaSwag	83.34	-	-	86.57
HumanEval	84.8	60.4	-	84.0
MATH	72.86	-	32.5	70.64
MMLU	72.36	68.5	61.3	79.18