L

Luxia 21.4b Alignment V1.2

由saltlux開發
LUXIA-21.4B-Alignment是一款擁有214億參數的大語言模型,在各類自然語言處理任務中展現出卓越性能。
下載量 1,839
發布時間 : 5/27/2024

模型概述

該模型在參數量35B以下的模型中展現了頂尖性能,甚至超越了72B參數模型和34Bx2混合專家模型。通過DPO訓練從luxia-21.4b-instruct模型衍生而來。

模型特點

高性能
在參數量35B以下的模型中展現出頂尖性能,超越更大規模的模型
先進的訓練方法
採用監督微調(SFT)和直接偏好優化(DPO)等前沿技術
優質訓練數據
融合多個精選數據集,包括alpaca-gpt4-data、SlimOrca等

模型能力

文本生成
問答系統
自然語言理解
數學推理

使用案例

教育
數學問題解答
解答GSM8K數據集中的數學問題
在GSM8K評估中獲得66.94分
知識問答
常識問答
回答ARC數據集中的常識問題
在ARC評估中獲得77.73分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase