Murai-350M-v0.1-beta开源文本生成模型 - 高效架构助你快速产出优质文本

首页

Murai 350M V0.1 Beta

由 DeepMount00 开发

这是一个基于transformers库构建的文本生成模型，具备高效的参数架构和出色的文本生成能力。

大型语言模型

Transformers

开源协议:Apache-2.0 #意大利语生成 #高效参数架构 #代码生成优化

下载量 140

发布时间 : 5/27/2025

模型简介

该模型主要用于文本生成任务，支持意大利语，适用于对话系统和代码生成等场景。

模型特点

高效参数架构

采用优化的深度架构，包括RMSNorm预归一化和分组查询注意力机制，提高内存效率。

高性能文本生成

使用SwiGLU激活函数和RoPE位置编码，提升模型性能和长度泛化能力。

对话系统支持

支持对话模板，可用于构建对话助手应用。

模型能力

文本生成

代码生成

对话系统

使用案例

编程辅助

Python代码生成

根据用户描述生成Python代码片段

示例中成功生成了两个数字相加的函数

对话系统

意大利语对话助手

构建意大利语对话助手

🚀 DeepMount00/Murai-350M-v0.1-beta

这是一个用于文本生成的模型，基于transformers库构建，具备高效的参数架构和出色的文本生成能力。

🚀 快速开始

以下是使用该模型进行文本生成的示例代码：

from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM

model_id = "DeepMount00/Murai-350M-v0.1-beta"

model = AutoModelForCausalLM.from_pretrained(model_id, trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(model_id)

t_pipeline = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    device_map="auto",
    return_full_text=True, 
    top_p = 0.95, 
    top_k = 50,
    repetition_penalty=1.2
)

SYSTEM_PROMPT = """Sei un assistente utile."""
TEMPERATURE = 0.1
MAX_NEW_TOKENS = 250

messages = [
    {"role": "system", "content": SYSTEM_PROMPT},
    {"role": "user", "content": """Scrivi una funzione python che somma due numeri"""},
]

conv_template = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )

outputs = t_pipeline(
    conv_template,
    max_new_tokens=MAX_NEW_TOKENS,
    do_sample=True,
    temperature=TEMPERATURE,
    num_return_sequences=1,
)
print(outputs[0]["generated_text"])

💻 使用示例

基础用法

from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM

model_id = "DeepMount00/Murai-350M-v0.1-beta"

model = AutoModelForCausalLM.from_pretrained(model_id, trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(model_id)

t_pipeline = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    device_map="auto",
    return_full_text=True, 
    top_p = 0.95, 
    top_k = 50,
    repetition_penalty=1.2
)

SYSTEM_PROMPT = """Sei un assistente utile."""
TEMPERATURE = 0.1
MAX_NEW_TOKENS = 250

messages = [
    {"role": "system", "content": SYSTEM_PROMPT},
    {"role": "user", "content": """Scrivi una funzione python che somma due numeri"""},
]

conv_template = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )

outputs = t_pipeline(
    conv_template,
    max_new_tokens=MAX_NEW_TOKENS,
    do_sample=True,
    temperature=TEMPERATURE,
    num_return_sequences=1,
)
print(outputs[0]["generated_text"])

🔧 技术细节

该模型使用了针对参数效率进行优化的深度架构：

采用RMSNorm的预归一化架构
采用分组查询注意力机制以提高内存效率
采用SwiGLU激活函数以提升性能
采用RoPE位置编码以实现更好的长度泛化能力

📚 引用说明

@misc{deepmount_llm_2024,
  title={Deep LLM: A 350M Parameter Language Model with 42 Layers},
  author={MicheleMontebovi},
  year={2025},
  url={https://huggingface.co/DeepMount00/Murai-350M-v0.1-beta}
}