Qwen2.5-Dyanka-7B-Preview开源语言模型 - 融合多模型畅聊问答超实用

Home

Qwen2.5 Dyanka 7B Preview

Developed by Xiaojian9992024

基于Qwen2.5架构的7B参数规模语言模型，通过TIES方法融合多个预训练模型而成

大型语言模型

Transformers

Open Source License:Apache-2.0 #多任务文本生成 #零样本学习 #高精度指令跟随

Downloads 1,497

Release Time : 2/25/2025

Model Overview

这是一个通过mergekit工具融合多个预训练语言模型得到的7B参数规模模型，采用TIES融合方法，具备文本生成和推理能力

Model Features

多模型融合

采用TIES方法融合了6个不同的预训练模型，整合各模型优势

平衡性能

在多种基准测试中表现均衡，特别是在IFEval上达到76.4%准确率

开源许可

使用Apache-2.0许可证，允许商业和研究用途

Model Capabilities

文本生成

指令跟随

逻辑推理

数学问题解答

知识问答

Use Cases

教育

数学问题解答

解决初中到高中难度的数学问题

在MATH Lvl 5测试中达到48.79%准确率

研究

知识问答系统

构建专业领域的问答系统

在MMLU-PRO测试中达到37.51%准确率

指标	值 (%)
平均	37.30
IFEval (0-Shot)	76.40
BBH (3-Shot)	36.62
MATH Lvl 5 (4-Shot)	48.79
GPQA (0-shot)	8.95
MuSR (0-shot)	15.51
MMLU-PRO (5-shot)	37.51

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Qwen2.5 Dyanka 7B Preview

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Qwen2.5-Dyanka-7B-Preview

🚀 快速开始

✨ 主要特性

合并详情

合并方法

合并的模型

配置

Open LLM Leaderboard 评估结果

📄 许可证