C

Chupacabra 7B V2

由perlthoughts開發
基於Mistral架構的7B參數大語言模型,採用SLERP融合技術合併多個高性能模型權重
下載量 99
發布時間 : 11/21/2023

模型概述

該模型通過先進的SLERP融合技術整合多個基於Mistral的模型,在文本生成任務中表現優異,支持多種自然語言處理任務

模型特點

SLERP融合技術
採用球面線性插值(SLERP)而非傳統權重平均,能更好地保留雙親模型特徵
高性能訓練
整合了採用DPO、SFT和強化學習等先進訓練方法的模型權重
多任務優化
在ARC、HellaSwag、MMLU等多個基準測試中表現優異

模型能力

文本生成
問答系統
推理任務
常識理解

使用案例

教育
學術問答
回答各類學科知識問題
在MMLU測試中準確率達63.6%
研究
推理挑戰
解決複雜的推理問題
在AI2推理挑戰賽中標準化準確率65.19%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase