Hunyuan-7B-Instruct開源大語言模型 - 免費部署支持中英文文本生成理解

首頁

Hunyuan 7B Instruct

由tencent開發

混元-7B-Instruct是騰訊發佈的中英文雙語大語言模型，具備強大的文本生成和理解能力，是目前最強的中文7B Dense模型之一。

大型語言模型

Transformers

英語開源協議:其他 #256K長文本處理 #中文最優7B模型 #GQA注意力機制

下載量 598

發布時間 : 1/24/2025

模型概述

混元-7B-Instruct是基於混元-7B-Pretrain微調的指令跟隨模型，專注於理解和執行用戶指令，適用於對話、問答等多種場景。

模型特點

長文本處理能力

支持擴展至256K上下文長度，適合處理長文檔和複雜任務

高效推理

提供vLLM和TensorRT-LLM兩種高效推理後端選擇

中文優化

針對中文任務進行了特別優化，在多箇中文基準測試中表現優異

兼容性

完全兼容Hugging Face格式，便於微調和部署

模型能力

文本生成

指令理解與執行

問答系統

長文本處理

代碼生成

數學推理

使用案例

智能對話

客服機器人

用於企業客服場景，自動回答用戶諮詢

內容創作

文章生成

根據用戶需求自動生成各類文章內容

教育

智能輔導

幫助學生解答學習問題，提供個性化輔導

🚀 混元-7B模型

混元此次發佈的7B模型，包括 Hunyuan-7B-Pretrain 和 Hunyuan-7B-Instruct，通過更優的數據分配和訓練，展現出強大性能，在計算和性能之間取得了良好平衡。它在眾多大語言模型中脫穎而出，是目前最強的中文7B稠密模型之一。

GITHUB

✨ 主要特性

技術優勢介紹

模型

擴展長文本能力至256K，並採用分組查詢注意力機制（Grouped Query Attention，GQA）。

推理框架

此次開源版本為混元-7B模型提供了兩種推理後端選項：流行的 vLLM-backend 和 TensorRT-LLM 後端。本次先開源 vLLM 解決方案，後續將發佈 TRT-LLM 解決方案。

訓練框架

混元-7B開源模型完全兼容 Hugging Face 格式，研究人員和開發者可使用 hf-deepspeed 框架進行模型微調。瞭解更多：Tencent-Hunyuan-Large。

📚 詳細文檔

基準測試

注意：以下基準測試由 TRT-LLM-backend 進行評估。

Hunyuan-7B-Pretrain

指標	Qwen2.5-7B	Llama3-8B	OLMO2-7B	HunYuan-7B-V2
MMLU	74.26	66.95	63.7	75.37
MMLU-Pro	46.17	34.04	31	47.54
MMLU-CF	61.01	55.21	52.94	59.62
MMLU-Redux	73.47	66.44	63.74	74.54
BBH	70.4	62.16	38.01	70.77
HellaSwag	75.82	78.24	61.97	80.77
WinoGrande	69.69	73.64	74.43	71.51
PIQA	79.33	80.52	80.63	81.45
SIQA	77.48	61.05	65.2	79.73
NaturalQuestions	31.77	35.43	36.9	33.52
DROP	68.2	60.13	60.8	68.63
ARC-C	91.64	77.59	74.92	91.97
TriviaQA	69.31	78.61	78	74.31
Chinese-SimpleQA	30.37	19.4	7.35	30.51
SimpleQA	4.98	7.68	4.51	3.73
CMMLU	81.39	50.25	38.79	82.19
C-Eval	81.11	50.4	38.53	82.12
C3	71.77	61.5	54	79.07
GSM8K	82.7	60.13	60.8	93.33
MATH	49.6	18.45	19	62.15
CMATH	84.33	52.83	44	88.5
HumanEval	57.93	35.98	15.24	59.15

Hunyuan-7B-Instruct

模型	Qwen2.5-7B-Instruct	Llama-3-8B-Instruct	OLMo-2-1124-7B-DPO	Hunyuan-7B-Instruct
ARC-C	89.83	82.4	-	88.81
BBH	66.24	-	46.6	76.47
CEval	76.82	-	-	81.8
CMMLU	78.55	-	-	82.29
DROP_F1	80.63	-	60.5	82.96
GPQA	36.87	34.6	-	47.98
Gsm8k	80.14	80.6	85.1	90.14
HellaSwag	83.34	-	-	86.57
HumanEval	84.8	60.4	-	84.0
MATH	72.86	-	32.5	70.64
MMLU	72.36	68.5	61.3	79.18