Phixtral-2x2_8开源AI模型 - 融合两模型优势，表现远超单一专家模型

首页

Phixtral 2x2 8

由 mlabonne 开发

phixtral-2x2_8 是首个基于两个 microsoft/phi-2 模型构建的混合专家模型（MoE），其表现优于每个单独的专家模型。

大型语言模型

Transformers

支持多种语言开源协议:MIT #混合专家模型 #代码生成优化 #轻量级推理

下载量 178

发布时间 : 1/7/2024

模型简介

phixtral-2x2_8 是一个基于两个 microsoft/phi-2 模型构建的混合专家模型（MoE），灵感来源于 mistralai/Mixtral-8x7B-v0.1 架构。它通过结合两个专家模型的优势，提供了更好的性能表现。

模型特点

混合专家模型（MoE）

结合两个 microsoft/phi-2 模型的优势，提供更好的性能表现。

高性能

在 AGIEval、GPT4All、TruthfulQA 和 Bigbench 等测试中表现优于单个专家模型。

灵活配置

支持动态配置专家数量，适应不同任务需求。

模型能力

文本生成

代码生成

自然语言处理

使用案例

代码生成

生成素数代码

根据输入生成打印 1 到 n 之间所有素数的 Python 代码。

生成高质量的代码片段，可直接用于开发。

自然语言处理

文本生成

根据输入的提示生成连贯的文本内容。

生成流畅、逻辑清晰的文本。

🚀 phixtral-2x2_8

phixtral-2x2_8 是首个基于两个 microsoft/phi-2 模型构建的混合专家模型（MoE），其灵感源自 mistralai/Mixtral-8x7B-v0.1 架构。该模型的性能优于单个专家模型。

你可以通过这个 Space 来试用它。

模型相关图片

🚀 快速开始

你可以通过这个 Colab 笔记本在免费的 T4 GPU 上以 4 位精度运行 Phixtral。

!pip install -q --upgrade transformers einops accelerate bitsandbytes

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "phixtral-2x2_8"
instruction = '''
    def print_prime(n):
        """
        Print all primes between 1 and n
        """
'''

torch.set_default_device("cuda")

# Load the model and tokenizer
model = AutoModelForCausalLM.from_pretrained(
    f"mlabonne/{model_name}", 
    torch_dtype="auto", 
    load_in_4bit=True, 
    trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained(
    f"mlabonne/{model_name}", 
    trust_remote_code=True
)

# Tokenize the input string
inputs = tokenizer(
    instruction, 
    return_tensors="pt", 
    return_attention_mask=False
)

# Generate text using the model
outputs = model.generate(**inputs, max_length=200)

# Decode and print the output
text = tokenizer.batch_decode(outputs)[0]
print(text)

✨ 主要特性

基于两个 microsoft/phi-2 模型构建的混合专家模型（MoE）。
灵感源自 mistralai/Mixtral-8x7B-v0.1 架构，性能优于单个专家模型。

🏆 评估

评估使用 LLM AutoEval 在 Nous 套件上进行。

模型	AGIEval	GPT4All	TruthfulQA	Bigbench	平均分
phixtral-2x2_8	34.1	70.44	48.78	37.82	47.78
dolphin-2_6-phi-2	33.12	69.85	47.39	37.2	46.89
phi-2-dpo	30.39	71.68	50.75	34.9	46.93
phi-2	27.98	70.8	44.43	35.21	44.61

你可以查看 YALL - Yet Another LLM Leaderboard 来将其与其他模型进行比较。

🧩 配置

该模型使用 mergekit 库的自定义版本（mixtral 分支）和以下配置构建：

base_model: cognitivecomputations/dolphin-2_6-phi-2
gate_mode: cheap_embed
experts:
  - source_model: cognitivecomputations/dolphin-2_6-phi-2
    positive_prompts: [""]
  - source_model: lxuechen/phi-2-dpo
    positive_prompts: [""]

💻 使用示例

基础用法

# 以下代码用于在免费的 T4 GPU 上以 4 位精度运行 Phixtral
!pip install -q --upgrade transformers einops accelerate bitsandbytes

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "phixtral-2x2_8"
instruction = '''
    def print_prime(n):
        """
        Print all primes between 1 and n
        """
'''

torch.set_default_device("cuda")

# 加载模型和分词器
model = AutoModelForCausalLM.from_pretrained(
    f"mlabonne/{model_name}", 
    torch_dtype="auto", 
    load_in_4bit=True, 
    trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained(
    f"mlabonne/{model_name}", 
    trust_remote_code=True
)

# 对输入字符串进行分词
inputs = tokenizer(
    instruction, 
    return_tensors="pt", 
    return_attention_mask=False
)

# 使用模型生成文本
outputs = model.generate(**inputs, max_length=200)

# 解码并打印输出
text = tokenizer.batch_decode(outputs)[0]
print(text)