Murai-350M-v0.1-beta開源文本生成模型 - 高效架構助你快速產出優質文本

首頁

Murai 350M V0.1 Beta

由DeepMount00開發

這是一個基於transformers庫構建的文本生成模型，具備高效的參數架構和出色的文本生成能力。

大型語言模型

Transformers

開源協議:Apache-2.0 #意大利語生成 #高效參數架構 #代碼生成優化

下載量 140

發布時間 : 5/27/2025

模型概述

該模型主要用於文本生成任務，支持意大利語，適用於對話系統和代碼生成等場景。

模型特點

高效參數架構

採用優化的深度架構，包括RMSNorm預歸一化和分組查詢注意力機制，提高內存效率。

高性能文本生成

使用SwiGLU激活函數和RoPE位置編碼，提升模型性能和長度泛化能力。

對話系統支持

支持對話模板，可用於構建對話助手應用。

模型能力

文本生成

代碼生成

對話系統

使用案例

編程輔助

Python代碼生成

根據用戶描述生成Python代碼片段

示例中成功生成了兩個數字相加的函數

對話系統

意大利語對話助手

構建意大利語對話助手

🚀 DeepMount00/Murai-350M-v0.1-beta

這是一個用於文本生成的模型，基於transformers庫構建，具備高效的參數架構和出色的文本生成能力。

🚀 快速開始

以下是使用該模型進行文本生成的示例代碼：

from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM

model_id = "DeepMount00/Murai-350M-v0.1-beta"

model = AutoModelForCausalLM.from_pretrained(model_id, trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(model_id)

t_pipeline = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    device_map="auto",
    return_full_text=True, 
    top_p = 0.95, 
    top_k = 50,
    repetition_penalty=1.2
)

SYSTEM_PROMPT = """Sei un assistente utile."""
TEMPERATURE = 0.1
MAX_NEW_TOKENS = 250

messages = [
    {"role": "system", "content": SYSTEM_PROMPT},
    {"role": "user", "content": """Scrivi una funzione python che somma due numeri"""},
]

conv_template = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )

outputs = t_pipeline(
    conv_template,
    max_new_tokens=MAX_NEW_TOKENS,
    do_sample=True,
    temperature=TEMPERATURE,
    num_return_sequences=1,
)
print(outputs[0]["generated_text"])

💻 使用示例

基礎用法

from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM

model_id = "DeepMount00/Murai-350M-v0.1-beta"

model = AutoModelForCausalLM.from_pretrained(model_id, trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(model_id)

t_pipeline = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    device_map="auto",
    return_full_text=True, 
    top_p = 0.95, 
    top_k = 50,
    repetition_penalty=1.2
)

SYSTEM_PROMPT = """Sei un assistente utile."""
TEMPERATURE = 0.1
MAX_NEW_TOKENS = 250

messages = [
    {"role": "system", "content": SYSTEM_PROMPT},
    {"role": "user", "content": """Scrivi una funzione python che somma due numeri"""},
]

conv_template = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )

outputs = t_pipeline(
    conv_template,
    max_new_tokens=MAX_NEW_TOKENS,
    do_sample=True,
    temperature=TEMPERATURE,
    num_return_sequences=1,
)
print(outputs[0]["generated_text"])

🔧 技術細節

該模型使用了針對參數效率進行優化的深度架構：

採用RMSNorm的預歸一化架構
採用分組查詢注意力機制以提高內存效率
採用SwiGLU激活函數以提升性能
採用RoPE位置編碼以實現更好的長度泛化能力

📚 引用說明

@misc{deepmount_llm_2024,
  title={Deep LLM: A 350M Parameter Language Model with 42 Layers},
  author={MicheleMontebovi},
  year={2025},
  url={https://huggingface.co/DeepMount00/Murai-350M-v0.1-beta}
}