H

Hunyuan 7B Instruct 0124

由 tencent 开发
混元-7B是腾讯发布的开源大语言模型,具有256K长文本处理能力和分组查询注意力机制(GQA),在中文7B稠密模型中表现优异。
下载量 590
发布时间 : 1/24/2025

模型简介

混元-7B模型是腾讯开发的大规模语言模型,专注于中文处理能力,在计算资源和性能表现之间取得了良好平衡。

模型特点

256K长文本处理
将长文本处理能力扩展到256K,适合处理长文档和复杂上下文
分组查询注意力机制
采用GQA(Grouped Query Attention)机制,提升模型效率
高性能推理
提供vLLM和TensorRT-LLM两种推理后端选择,优化推理速度
中文优化
针对中文任务进行了特别优化,在中文基准测试中表现优异

模型能力

文本生成
问答系统
代码生成
数学推理
知识问答
长文本理解

使用案例

教育
智能辅导
帮助学生解答各类学科问题
在数学推理(GSM8K)测试中达到93.33%准确率
研究
学术论文分析
处理和分析长篇幅学术论文
支持256K上下文长度
商业
智能客服
处理客户咨询和问题解答
在中文问答测试中表现优异
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase