🚀 li-14b-v0.4語言模型
li-14b-v0.4是基於多個預訓練模型合併得到的語言模型,在文本生成任務上表現出色,在多個公開數據集的評估中取得了不錯的成績,為自然語言處理領域提供了新的解決方案。
🚀 快速開始
此模型當前在Open LLM Leaderboard上參數不超過15B的模型中排名第1,在所有模型中排名第50。
⚠️ 重要提示
點擊下面的圖片可瞭解更多關於世紀開元的信息。
✨ 主要特性
模型信息
屬性 |
詳情 |
庫名稱 |
transformers |
標籤 |
mergekit、merge |
基礎模型 |
Qwen/Qwen2.5-14B-Instruct、Qwen/Qwen2.5-Coder-14B、deepseek-ai/DeepSeek-R1-Distill-Qwen-14B、huihui-ai/DeepSeek-R1-Distill-Qwen-14B-abliterated-v2、tanliboy/lambda-qwen2.5-14b-dpo-test、SicariusSicariiStuff/Impish_QWEN_14B-1M、Qwen/Qwen2.5-14B |
模型類型 |
文本生成 |
支持語言 |
中文、英文、法語、沙特阿拉伯語、德語 |
許可證 |
apache-2.0 |
世紀開元公司介紹
世紀開元智印互聯科技集團股份有限公司創立於2001年3月9日,總部位於山東省濟南市。歷經20餘年發展,世紀開元以技術創新為核心,實現互聯網與傳統印刷行業的深度融合,探索出了區別於傳統印刷行業的新模式、新業態。
世紀開元主要從事定製化影像、商務印刷及包裝印刷類產品的研發、設計、生產及銷售,通過將互聯網、數字化、自動化和智能化等新模式和新技術與包裝印刷行業相結合的方式,使小批量個性化定製產品訂單得以相對標準化、規模化生產,旨在滿足個人消費者及各類企業用戶的小批量定製化需求,為用戶提供一站式場景化定製印刷服務,實現全流程智能製造,已成長為業內領先的“工業互聯網”印刷企業。
在未來發展中,世紀開元將一如既往地加大技術研發投入,深度融合互聯網、大數據、人工智能等新一代信息技術,注重專項技術人才的培養,積極引進數字化、智能化手段優化創新業務流程和實現用戶體驗的提升,並通過多維度的企業發展,帶動行業協同發展,促進印刷行業新舊動能轉換,開拓印刷行業發展新方向。
瞭解更多,請訪問我們的官網:世紀開元
🔧 技術細節
模型合併詳情
合併方法
該模型使用Model Stock合併方法,以Qwen/Qwen2.5-14B-Instruct為基礎模型進行合併。
合併的模型
配置文件
以下是用於生成此模型的YAML配置文件:
models:
- model: deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
- model: huihui-ai/DeepSeek-R1-Distill-Qwen-14B-abliterated-v2
- model: Qwen/Qwen2.5-14B
- model: Qwen/Qwen2.5-14B-Instruct
- model: Qwen/Qwen2.5-Coder-14B
- model: SicariusSicariiStuff/Impish_QWEN_14B-1M
- model: tanliboy/lambda-qwen2.5-14b-dpo-test
merge_method: model_stock
base_model: Qwen/Qwen2.5-14B-Instruct
normalize: true
int8_mask: true
dtype: bfloat16
📚 詳細文檔
詳細結果可查看這裡
指標 |
值 |
平均值 |
43.66 |
IFEval (0-Shot) |
81.33 |
BBH (3-Shot) |
50.38 |
MATH Lvl 5 (4-Shot) |
55.74 |
GPQA (0-shot) |
11.86 |
MuSR (0-shot) |
16.35 |
MMLU-PRO (5-shot) |
46.30 |
📄 許可證
本模型使用的許可證為apache-2.0。