C

Caplattessdolxaboros Yi 34B 200K DARE Ties HighDensity

由brucethemoose開發
這是一個基於Yi-34B-200K基礎模型,通過DARE Ties方法合併多個同源模型的高密度合併模型,具有200K長上下文處理能力。
下載量 94
發布時間 : 12/9/2023

模型概述

該模型通過mergekit的DARE Ties方法合併了Dolphin-2.2-yi-34b-200k、Nous-Capybara-34B、Tess-M-v1.4等多個同源模型,保留了Yi-34B-200K的長上下文能力,同時在多項基準測試中表現優異。

模型特點

長上下文處理
支持200K tokens的長上下文處理,適合處理長文檔和複雜推理任務
高密度合併
採用DARE Ties方法以高於推薦密度合併多個同源模型,提升模型性能
多模型優勢融合
整合了Dolphin、Capybara、Tess等多個模型的優勢,具備多樣化能力
高效推理
24GB GPU即可運行,在exllamav2上可支持45K-75K上下文長度

模型能力

文本生成
長文本理解
複雜推理
問答系統
知識問答

使用案例

知識問答
AI2推理挑戰賽
在AI2推理挑戰賽(ARC)上的少量樣本表現
標準化準確率67.41
常識推理
HellaSwag測試
在HellaSwag數據集上的常識推理能力
標準化準確率85.77
數學推理
GSM8k數學問題
解決小學數學應用題的能力
準確率61.33
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase