Phi-4-Model-Stock-v2開源大語言模型 - 多變體合併，基準測試表現出色

首頁

Phi 4 Model Stock V2

由bunnycore開發

Phi-4-Model-Stock-v2是基於多個Phi-4變體模型合併而成的大語言模型，採用model_stock合併方法，在多個基準測試中表現良好。

大型語言模型

Transformers

#多任務文本生成 #高精度推理 #零樣本學習

下載量 56

發布時間 : 1/17/2025

模型概述

該模型是通過合併多個Phi-4變體模型創建的預訓練語言模型，專注於文本生成任務，在開放LLM排行榜的多個評估數據集中展示了不錯的性能。

模型特點

多模型合併

採用model_stock方法合併了多個Phi-4變體模型，整合了不同模型的優勢

基準測試表現

在IFEval、BBH等多個基準測試中展示了穩定的性能表現

文本生成能力

專注於文本生成任務，支持多種上下文長度的文本處理

模型能力

文本生成

指令跟隨

少樣本學習

使用案例

評估測試

IFEval評估

用於評估模型在指令跟隨任務中的表現

實例級嚴格準確率63.75

BBH評估

用於評估模型在複雜推理任務中的表現

標準化準確率54.69

教育研究

數學問題解答

可用於解答數學競賽級別的問題

MATH數據集精確匹配35.88

指標	值
平均值	38.87
IFEval (0-Shot)	63.75
BBH (3-Shot)	54.69
MATH Lvl 5 (4-Shot)	35.88
GPQA (0-shot)	13.20
MuSR (0-shot)	17.57
MMLU-PRO (5-shot)	48.12

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Phi 4 Model Stock V2

模型概述

模型特點

模型能力

使用案例

🚀 Phi-4-Model-Stock-v2

🚀 快速開始

✨ 主要特性

合併詳情

合併方法

參與合併的模型

配置

📚 詳細文檔

Open LLM Leaderboard 評估結果