Phi-3-mini-4k-instruct-GGUF开源模型 - 轻量化高质量推理，免费好用！

首页

Phi 3 Mini 4k Instruct GGUF

由 brittlewis12 开发

Phi-3-Mini-4K-Instruct是一个38亿参数的轻量级前沿开源模型，使用Phi-3数据集训练而成，注重高质量和推理密集特性。

大型语言模型开源协议:MIT #轻量级推理 #指令优化 #代码生成

下载量 170

发布时间 : 4/24/2024

模型简介

微软开发的轻量级开源语言模型，专注于高质量文本生成和推理任务，支持4K上下文长度。

模型特点

轻量高效

仅38亿参数却保持强大性能，适合资源有限环境部署

高质量推理

使用精选数据集训练，特别优化复杂推理任务表现

4K上下文支持

支持长达4096token的上下文记忆

指令优化

专门针对指令跟随场景进行优化

模型能力

文本生成

指令理解

代码生成

结构化输出（JSON/XML）

复杂推理

使用案例

开发辅助

代码生成

根据自然语言描述生成代码片段

HumanEval基准测试59.1分

教育

数学问题解答

解决数学推理问题

GSM-8K基准测试82.5分

商业分析

结构化报告生成

将非结构化数据转换为JSON/XML格式

JSON结构输出52.3分，XML结构输出49.8分

🚀 Phi 3 Mini 4K Instruct GGUF

本项目提供了微软 Phi 3 Mini 4K Instruct 模型的 GGUF 格式文件。Phi-3-Mini-4K-Instruct 是一个参数为 38 亿的轻量级、最先进的开源模型，它基于 Phi-3 数据集进行训练，该数据集包含合成数据和经过筛选的公开网站数据，注重高质量和强推理能力。

你可以在微软的模型页面了解更多信息。

🚀 快速开始

本仓库包含了微软 Phi 3 Mini 4K Instruct 的 GGUF 格式模型文件。

模型信息

属性	详情
模型类型	phi3
训练数据	包含合成数据和经过筛选的公开网站数据
模型创建者	Microsoft
量化者	brittlewis12
许可证	MIT
许可证链接	https://huggingface.co/microsoft/Phi-3-mini-4k-instruct/resolve/main/LICENSE

什么是 GGUF？

GGUF 是一种用于表示 AI 模型的文件格式。它是该格式的第三个版本，由 llama.cpp 团队于 2023 年 8 月 21 日推出。它取代了 GGML，而 llama.cpp 不再支持 GGML。本模型使用 llama.cpp 构建 3432（修订版本 45f2c19），通过 autogguf 进行转换。

提示模板

<|system|>
{{system_prompt}}<|end|>
<|user|>
{{prompt}}<|end|>
<|assistant|>

📦 安装指南

可在 iPhone、iPad 和 Mac 上使用 cnvrs 下载并运行该模型！

cnvrs.ai

cnvrs 是在你的设备上运行私有、本地 AI 的最佳应用程序：

可创建并保存带有自定义系统提示和温度设置的角色。
可下载并试验你能在 HuggingFace 上找到的任何 GGUF 模型！
可使用自定义主题颜色进行个性化设置。
由 Metal ⚡️ 和 Llama.cpp 提供支持，在响应流式传输期间有触觉反馈！
立即在 Testflight 上亲自试用！
关注 cnvrs 的 Twitter 以获取最新信息。

📚 详细文档

原始模型评估

7 月更新与 4 月原始版本对比

基准测试	原始版本	2024 年 6 月更新版本
Instruction Extra Hard	5.7	6.0
Instruction Hard	4.9	5.1
Instructions Challenge	24.6	42.3
JSON Structure Output	11.5	52.3
XML Structure Output	14.4	49.8
GPQA	23.7	30.6
MMLU	68.8	70.9
平均	21.9	36.7

4 月原始版本

按照惯例，我们在温度为 0 的情况下使用少样本提示来评估模型。提示和样本数量是微软内部评估语言模型工具的一部分，特别是我们没有针对 Phi-3 对评估流程进行优化。更具体地说，我们没有更改提示、选择不同的少样本示例、更改提示格式或对模型进行任何其他形式的优化。每个基准测试的 k 样本示例数量会列出。

	Phi-3-Mini-4K-In 38 亿参数	Phi-2 27 亿参数	Mistral 70 亿参数	Gemma 70 亿参数	Llama-3-In 80 亿参数	Mixtral 8x70 亿参数	GPT-3.5 版本 1106
MMLU 5 样本	68.8	56.3	61.7	63.6	66.5	68.4	71.4
HellaSwag 5 样本	76.7	53.6	58.5	49.8	71.1	70.4	78.8
ANLI 7 样本	52.8	42.5	47.1	48.7	57.3	55.2	58.1
GSM-8K 0 样本; CoT	82.5	61.1	46.4	59.8	77.4	64.7	78.1
MedQA 2 样本	53.8	40.9	49.6	50.0	60.5	62.2	63.4
AGIEval 0 样本	37.5	29.8	35.1	42.1	42.0	45.2	48.4
TriviaQA 5 样本	64.0	45.2	72.3	75.2	67.7	82.2	85.8
Arc-C 10 样本	84.9	75.9	78.6	78.3	82.8	87.3	87.4
Arc-E 10 样本	94.6	88.5	90.6	91.4	93.4	95.6	96.3
PIQA 5 样本	84.2	60.2	77.7	78.1	75.7	86.0	86.6
SociQA 5 样本	76.6	68.3	74.6	65.5	73.9	75.9	68.3
BigBench-Hard 0 样本	71.7	59.4	57.3	59.6	51.5	69.7	68.32
WinoGrande 5 样本	70.8	54.7	54.2	55.6	65	62.0	68.8
OpenBookQA 10 样本	83.2	73.6	79.8	78.6	82.6	85.8	86.0
BoolQ 0 样本	77.6	--	72.2	66.0	80.9	77.6	79.1
CommonSenseQA 10 样本	80.2	69.3	72.6	76.2	79	78.1	79.6
TruthfulQA 10 样本	65.0	--	52.1	53.0	63.2	60.1	85.8
HumanEval 0 样本	59.1	47.0	28.0	34.1	60.4	37.8	62.2
MBPP 3 样本	53.8	60.6	50.8	51.5	67.7	60.2	77.8