🚀 li-14b-v0.4语言模型
li-14b-v0.4是基于多个预训练模型合并得到的语言模型,在文本生成任务上表现出色,在多个公开数据集的评估中取得了不错的成绩,为自然语言处理领域提供了新的解决方案。
🚀 快速开始
此模型当前在Open LLM Leaderboard上参数不超过15B的模型中排名第1,在所有模型中排名第50。
⚠️ 重要提示
点击下面的图片可了解更多关于世纪开元的信息。
✨ 主要特性
模型信息
属性 |
详情 |
库名称 |
transformers |
标签 |
mergekit、merge |
基础模型 |
Qwen/Qwen2.5-14B-Instruct、Qwen/Qwen2.5-Coder-14B、deepseek-ai/DeepSeek-R1-Distill-Qwen-14B、huihui-ai/DeepSeek-R1-Distill-Qwen-14B-abliterated-v2、tanliboy/lambda-qwen2.5-14b-dpo-test、SicariusSicariiStuff/Impish_QWEN_14B-1M、Qwen/Qwen2.5-14B |
模型类型 |
文本生成 |
支持语言 |
中文、英文、法语、沙特阿拉伯语、德语 |
许可证 |
apache-2.0 |
世纪开元公司介绍
世纪开元智印互联科技集团股份有限公司创立于2001年3月9日,总部位于山东省济南市。历经20余年发展,世纪开元以技术创新为核心,实现互联网与传统印刷行业的深度融合,探索出了区别于传统印刷行业的新模式、新业态。
世纪开元主要从事定制化影像、商务印刷及包装印刷类产品的研发、设计、生产及销售,通过将互联网、数字化、自动化和智能化等新模式和新技术与包装印刷行业相结合的方式,使小批量个性化定制产品订单得以相对标准化、规模化生产,旨在满足个人消费者及各类企业用户的小批量定制化需求,为用户提供一站式场景化定制印刷服务,实现全流程智能制造,已成长为业内领先的“工业互联网”印刷企业。
在未来发展中,世纪开元将一如既往地加大技术研发投入,深度融合互联网、大数据、人工智能等新一代信息技术,注重专项技术人才的培养,积极引进数字化、智能化手段优化创新业务流程和实现用户体验的提升,并通过多维度的企业发展,带动行业协同发展,促进印刷行业新旧动能转换,开拓印刷行业发展新方向。
了解更多,请访问我们的官网:世纪开元
🔧 技术细节
模型合并详情
合并方法
该模型使用Model Stock合并方法,以Qwen/Qwen2.5-14B-Instruct为基础模型进行合并。
合并的模型
配置文件
以下是用于生成此模型的YAML配置文件:
models:
- model: deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
- model: huihui-ai/DeepSeek-R1-Distill-Qwen-14B-abliterated-v2
- model: Qwen/Qwen2.5-14B
- model: Qwen/Qwen2.5-14B-Instruct
- model: Qwen/Qwen2.5-Coder-14B
- model: SicariusSicariiStuff/Impish_QWEN_14B-1M
- model: tanliboy/lambda-qwen2.5-14b-dpo-test
merge_method: model_stock
base_model: Qwen/Qwen2.5-14B-Instruct
normalize: true
int8_mask: true
dtype: bfloat16
📚 详细文档
详细结果可查看这里
指标 |
值 |
平均值 |
43.66 |
IFEval (0-Shot) |
81.33 |
BBH (3-Shot) |
50.38 |
MATH Lvl 5 (4-Shot) |
55.74 |
GPQA (0-shot) |
11.86 |
MuSR (0-shot) |
16.35 |
MMLU-PRO (5-shot) |
46.30 |
📄 许可证
本模型使用的许可证为apache-2.0。