H

Hunyuan 7B Instruct 0124

由tencent開發
混元-7B是騰訊發佈的開源大語言模型,具有256K長文本處理能力和分組查詢注意力機制(GQA),在中文7B稠密模型中表現優異。
下載量 590
發布時間 : 1/24/2025

模型概述

混元-7B模型是騰訊開發的大規模語言模型,專注於中文處理能力,在計算資源和性能表現之間取得了良好平衡。

模型特點

256K長文本處理
將長文本處理能力擴展到256K,適合處理長文檔和複雜上下文
分組查詢注意力機制
採用GQA(Grouped Query Attention)機制,提升模型效率
高性能推理
提供vLLM和TensorRT-LLM兩種推理後端選擇,優化推理速度
中文優化
針對中文任務進行了特別優化,在中文基準測試中表現優異

模型能力

文本生成
問答系統
代碼生成
數學推理
知識問答
長文本理解

使用案例

教育
智能輔導
幫助學生解答各類學科問題
在數學推理(GSM8K)測試中達到93.33%準確率
研究
學術論文分析
處理和分析長篇幅學術論文
支持256K上下文長度
商業
智能客服
處理客戶諮詢和問題解答
在中文問答測試中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase