F

Fusellm 7B

由Wanfq開發
FuseLLM-7B是一個融合了多個開源大型語言模型知識的統一模型,通過知識融合技術將不同架構的LLM能力整合到一個模型中。
下載量 45
發布時間 : 1/21/2024

模型概述

FuseLLM-7B通過融合Llama-2-7B、OpenLLaMA-7B和MPT-7B三個不同架構的模型,實現了知識整合和能力增強。該模型在多個基準測試中表現出色,適用於文本生成、推理等多種任務。

模型特點

多模型知識融合
整合了Llama-2-7B、OpenLLaMA-7B和MPT-7B三個不同架構模型的知識和能力
跨架構支持
能夠融合不同架構的模型,突破了傳統模型融合的限制
性能提升
在多個基準測試中表現優於單個源模型
輕量級訓練
通過輕量級持續訓練實現知識轉移,訓練效率高

模型能力

文本生成
常識推理
代碼生成
問答系統
閱讀理解
機器翻譯

使用案例

自然語言處理
智能問答系統
用於構建能夠回答複雜問題的問答系統
在TruthfulQA基準上達到38.17的mc2分數
代碼生成
支持多語言編程代碼生成
在MultiPL-E基準上達到15.56的分數
教育輔助
科學問題解答
幫助學生解答科學和數學問題
在GSM8k數學基準上達到14.33的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase