Rhea 72b V0.5
Rhea-72b-v0.5是基於Smaug-72B-v0.1微調的大語言模型,在HuggingFace開放大模型排行榜上排名第一。
下載量 103
發布時間 : 3/22/2024
模型概述
Rhea項目研究各種學習方法以提高大語言模型性能,使用nox框架進行微調,結合監督微調(SFT)和DPO學習方法。
模型特點
SGD方法
創新的自生成數據集創建方法,用於DPO學習,通過比較模型生成與正確答案來提升性能。
高性能
在HuggingFace開放大模型排行榜上綜合得分81.22,排名第一。
多樣化訓練數據
使用包含多種來源的監督微調數據集(datasets_enconv_4m)和DPO數據集(datasets_encomp_151k)。
模型能力
文本生成
推理能力
問答系統
數學計算
語言理解
使用案例
學術研究
AI2推理挑戰賽
解決複雜的科學推理問題
標準化準確率79.78
MMLU測試
多學科知識理解和應用
準確率77.95
商業應用
數學問題解決
解決GSM8k數學問題
準確率76.12
語言理解
HellaSwag常識推理
標準化準確率91.15
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98