Phixtral-2x2_8開源AI模型 - 融合兩模型優勢，表現遠超單一專家模型

首頁

Phixtral 2x2 8

由mlabonne開發

phixtral-2x2_8 是首個基於兩個 microsoft/phi-2 模型構建的混合專家模型（MoE），其表現優於每個單獨的專家模型。

大型語言模型

Transformers

支持多種語言開源協議:MIT #混合專家模型 #代碼生成優化 #輕量級推理

下載量 178

發布時間 : 1/7/2024

模型概述

phixtral-2x2_8 是一個基於兩個 microsoft/phi-2 模型構建的混合專家模型（MoE），靈感來源於 mistralai/Mixtral-8x7B-v0.1 架構。它通過結合兩個專家模型的優勢，提供了更好的性能表現。

模型特點

混合專家模型（MoE）

結合兩個 microsoft/phi-2 模型的優勢，提供更好的性能表現。

高性能

在 AGIEval、GPT4All、TruthfulQA 和 Bigbench 等測試中表現優於單個專家模型。

靈活配置

支持動態配置專家數量，適應不同任務需求。

模型能力

文本生成

代碼生成

自然語言處理

使用案例

代碼生成

生成素數代碼

根據輸入生成打印 1 到 n 之間所有素數的 Python 代碼。

生成高質量的代碼片段，可直接用於開發。

自然語言處理

文本生成

根據輸入的提示生成連貫的文本內容。

生成流暢、邏輯清晰的文本。

🚀 phixtral-2x2_8

phixtral-2x2_8 是首個基於兩個 microsoft/phi-2 模型構建的混合專家模型（MoE），其靈感源自 mistralai/Mixtral-8x7B-v0.1 架構。該模型的性能優於單個專家模型。

你可以通過這個 Space 來試用它。

模型相關圖片

🚀 快速開始

你可以通過這個 Colab 筆記本在免費的 T4 GPU 上以 4 位精度運行 Phixtral。

!pip install -q --upgrade transformers einops accelerate bitsandbytes

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "phixtral-2x2_8"
instruction = '''
    def print_prime(n):
        """
        Print all primes between 1 and n
        """
'''

torch.set_default_device("cuda")

# Load the model and tokenizer
model = AutoModelForCausalLM.from_pretrained(
    f"mlabonne/{model_name}", 
    torch_dtype="auto", 
    load_in_4bit=True, 
    trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained(
    f"mlabonne/{model_name}", 
    trust_remote_code=True
)

# Tokenize the input string
inputs = tokenizer(
    instruction, 
    return_tensors="pt", 
    return_attention_mask=False
)

# Generate text using the model
outputs = model.generate(**inputs, max_length=200)

# Decode and print the output
text = tokenizer.batch_decode(outputs)[0]
print(text)

✨ 主要特性

基於兩個 microsoft/phi-2 模型構建的混合專家模型（MoE）。
靈感源自 mistralai/Mixtral-8x7B-v0.1 架構，性能優於單個專家模型。

🏆 評估

評估使用 LLM AutoEval 在 Nous 套件上進行。

模型	AGIEval	GPT4All	TruthfulQA	Bigbench	平均分
phixtral-2x2_8	34.1	70.44	48.78	37.82	47.78
dolphin-2_6-phi-2	33.12	69.85	47.39	37.2	46.89
phi-2-dpo	30.39	71.68	50.75	34.9	46.93
phi-2	27.98	70.8	44.43	35.21	44.61

你可以查看 YALL - Yet Another LLM Leaderboard 來將其與其他模型進行比較。

🧩 配置

該模型使用 mergekit 庫的自定義版本（mixtral 分支）和以下配置構建：

base_model: cognitivecomputations/dolphin-2_6-phi-2
gate_mode: cheap_embed
experts:
  - source_model: cognitivecomputations/dolphin-2_6-phi-2
    positive_prompts: [""]
  - source_model: lxuechen/phi-2-dpo
    positive_prompts: [""]

💻 使用示例

基礎用法

# 以下代碼用於在免費的 T4 GPU 上以 4 位精度運行 Phixtral
!pip install -q --upgrade transformers einops accelerate bitsandbytes

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "phixtral-2x2_8"
instruction = '''
    def print_prime(n):
        """
        Print all primes between 1 and n
        """
'''

torch.set_default_device("cuda")

# 加載模型和分詞器
model = AutoModelForCausalLM.from_pretrained(
    f"mlabonne/{model_name}", 
    torch_dtype="auto", 
    load_in_4bit=True, 
    trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained(
    f"mlabonne/{model_name}", 
    trust_remote_code=True
)

# 對輸入字符串進行分詞
inputs = tokenizer(
    instruction, 
    return_tensors="pt", 
    return_attention_mask=False
)

# 使用模型生成文本
outputs = model.generate(**inputs, max_length=200)

# 解碼並打印輸出
text = tokenizer.batch_decode(outputs)[0]
print(text)