UNA SimpleSmaug 34b V1beta

U

UNA SimpleSmaug 34b V1beta

由fblgit開發

基於Smaug-34B的監督微調模型，專注於提升數學和推理能力，在34B規模模型中表現優異。

大型語言模型

開源協議:Apache-2.0 #數學推理優化 #高精度文本生成 #SFT微調增強

下載量 18

發布時間 : 2/5/2024

模型概述

該模型是基於Smaug-34B-v0.1進行監督微調（SFT）的變體，通過簡單數學數據集的訓練提升了數學和推理能力，同時保留了原始模型的性能。在開放LLM排行榜中表現優異，是34B規模模型的領先者。

模型特點

數學能力提升

通過簡單數學數據集的監督微調，顯著提升了數學和推理能力。

34B規模領先

在34B參數規模的模型中表現優異，開放LLM排行榜評分77.41。

注意力層優化

僅在注意力層應用UNA技術，未修改MLP層，保留了原始模型的核心能力。

模型能力

文本生成

數學推理

邏輯推理

問答系統

使用案例

教育

數學問題解答

解答各類數學問題，包括算術、代數等。

GSM8k數據集準確率72.48%

評估測試

標準測試評估

用於AI2推理挑戰賽、MMLU等標準測試評估。

AI2推理挑戰賽74.57分，MMLU 76.68分

🚀 UNA-SimpleSmaug-34b-v1beta

UNA-SimpleSmaug-34b-v1beta是一款強大的模型，在2024年2月4日的評估中，它在34B模型裡表現卓越，得分達到77.41，超越了其基礎模型Smaug-34B-v0.1。該模型經過SFT訓練，讓Smaug內部的計算機制恢復正常，還支持進一步訓練。

🚀 快速開始

本模型基於Smaug，使用了SimpleMath數據集，並在Axolotl上進行訓練。它僅在注意力層應用了UNA，而非MLP層。

✨ 主要特性

基於Smaug：繼承了Smaug的優秀特性。
SimpleMath數據集：使用該數據集進行訓練，提升了模型的數學和推理能力。
Axolotl訓練：在Axolotl上完成訓練過程。
UNA應用：僅在注意力層應用UNA，優化模型性能。

📚 詳細文檔

實驗

本次實驗旨在探究在SFT階段將SimpleMath應用於注意力層對神經網絡的整體影響。結果表明，該模型在不降低之前訓練效果的前提下，提升了數學和推理能力。

評估

評估指標

指標	值
平均	77.41
AI2推理挑戰（25次少樣本學習）	74.57
HellaSwag（10次少樣本學習）	86.74
MMLU（5次少樣本學習）	76.68
TruthfulQA（0次少樣本學習）	70.17
Winogrande（5次少樣本學習）	83.82
GSM8k（5次少樣本學習）	72.48

任務評估

任務	版本	指標	值
arc_challenge	HF	acc_norm	0.7457337883959
gsm8k	HF	acc	0.7247915087187
mmlu	HF	acc	0.7649553475572
mmlu	HF	acc_norm	0.7681713551647
hellaswag	HF	acc_norm	0.8673571001792
truthfulqa	HF	mc2	0.7016557407771
winogrande	HF	acc	0.8382004735595

其他評估

指標	值
平均	23.12
IFEval（0次少樣本學習）	45.56
BBH（3次少樣本學習）	32.78
MATH Lvl 5（4次少樣本學習）	0.15
GPQA（0次少樣本學習）	8.95
MuSR（0次少樣本學習）	11.96
MMLU-PRO（5次少樣本學習）	39.33

模型血緣檢測

你可以使用我們的ModelSimilarities工具來確認該模型的血緣關係。

📄 許可證

本模型採用Apache-2.0許可證。

UNA

更新說明

3月更新：該模型在34B模型中依舊穩居榜首，Smaug 70B在70B模型中也保持領先。

關於其他模型

有人疑惑為何沒有基於Hermes或Smaug 70B的UNA模型。開發者認為，對於一些被廣泛認為實用性不高的模型，花費時間進行UNA處理可能不值得。不過，開發者希望利用UNA讓優秀模型重煥生機，就像UNA-Dolphin在短時間內展現出的出色性能一樣。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase