C

Cosmicbun 8B

由aloobun開發
CosmicBun-8B是基於Llama3-8B架構的合併模型,專注於數學、物理、化學和生物等科學領域的文本生成任務。
下載量 19
發布時間 : 5/1/2024

模型概述

該模型通過合併多個Llama3-8B變體(包括dolphin-2.9、Einstein-v6.1和neural-chat-v1)而創建,旨在提升在科學相關任務上的表現。

模型特點

科學領域優化
專注於數學、物理、化學和生物等科學領域的文本生成能力
多模型合併
採用DARE/TIES方法合併多個Llama3-8B變體,結合各模型優勢
分層參數配置
對不同模型層採用不同的密度和權重配置,優化模型性能

模型能力

文本生成
科學問題解答
數學推理
物理概念解釋
化學知識問答
生物知識問答

使用案例

教育
科學問題解答
回答學生提出的數學、物理、化學和生物相關問題
在GSM8k數學推理任務上達到68.23%準確率
研究輔助
科學概念解釋
幫助研究人員快速理解複雜科學概念
在MMLU綜合知識測試中達到65.53%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase