UNA-TheBeagle-7b-v1開源AI模型 - 在多任務中表現優異免費可用

首頁

UNA TheBeagle 7b V1

由fblgit開發

TheBeagle是基於The Bagel數據集訓練的70億參數模型，採用DPO（直接偏好優化）和UNA（統一神經架構）技術優化，在多任務中表現優異。

大型語言模型

Transformers

#DPO優化 #多任務通用 #學術研究專用

下載量 88

發布時間 : 1/9/2024

模型概述

該模型是基於精選DPO配對集優化的70億參數大語言模型，採用英特爾neural-chat模型作為基礎，在多項基準測試中表現突出。

模型特點

DPO優化

採用直接偏好優化技術對精選DPO配對集進行訓練

UNA架構

應用統一神經架構優化感知機層，學習速率設為3.5e-7

高性能表現

在ARC、GSM8K、HellaSwag等多個基準測試中取得優異成績

數據去汙染

數據集經過嚴格去汙染處理，確保訓練質量

模型能力

文本生成

問答系統

數學推理

常識推理

邏輯推理

使用案例

學術研究

自然語言處理研究

可用於語言模型性能比較和新技術驗證

在多個基準測試中表現優異

教育應用

數學問題解答

解決GSM8K等數學問題

精確匹配率達72.1%

🚀 UNA-TheBeagle-7b-v1

UNA-TheBeagle-7b-v1是一個基於70億參數的模型，在The Bagel數據集上進行訓練。它在一系列精心挑選的DPO對上應用了DPO（Direct Preference Optimization）和UNA技術，在多項任務中表現出色。

✨ 主要特性

在Hugging Face排行榜上排名第一，成績顯著！ARC得分為73分，且各項指標均衡。
數據集使用原始的Bagel代碼生成，包含去汙染步驟。
以英特爾最新的neural - chat模型為基礎模型。

TheBeagle

📚 詳細文檔

評估結果

使用VLLM進行評估，實際結果可能與排行榜上的略有差異，但相差不大。

vllm (pretrained=fblgit/UNA-TheBeagle-7b-v1,dtype=auto,tensor_parallel_size=1,gpu_memory_utilization=0.8,data_parallel_size=8,trust_remote_code=True), gen_kwargs: (None), limit: None, num_fewshot: None, batch_size: 32
|    任務     |版本|  過濾條件  |n - 樣本數|  指標   |值 |   |標準差|
|--------------|-------|----------|-----:|-----------|-----:|---|-----:|
|arc_challenge |Yaml   |none      |    25|準確率        |0.7090|±  |0.0133|
|              |       |none      |    25|歸一化準確率   |0.7329|±  |0.0129|
|gsm8k         |Yaml   |獲取答案|     5|精確匹配率|0.7210|±  |0.0124|
|hellaswag     |Yaml   |none      |    10|準確率        |0.7202|±  |0.0045|
|              |       |none      |    10|歸一化準確率   |0.8792|±  |0.0033|
|truthfulqa_mc2|Yaml   |none      |     0|準確率        |0.7062|±  |0.0151|
|winogrande    |Yaml   |none      |     5|準確率        |0.8366|±  |0.0104|