GreenMind-Medium-14B-R1開源越南語語言模型 - 免費部署解決中級推理難題

首頁

Greenmind Medium 14B R1

由GreenNode開發

GreenMind-Medium-14B-R1 是一款中等規模的越南語語言模型，能夠有效解決需要中級推理的問題，例如常識、數學、自然科學和社會科學主題。

大型語言模型

Safetensors

支持多種語言開源協議:MIT #越南語推理優化 #多語言數學解題 #結構化思維生成

下載量 50

發布時間 : 4/25/2025

模型概述

該模型基於 Qwen/Qwen2.5-14B-Instruct 進行微調，採用 Group Relative Policy Optimization 策略，生成邏輯連貫的響應。

模型特點

中級推理能力

能夠有效解決需要中級推理的問題，如常識、數學、自然科學和社會科學主題。

邏輯連貫響應

採用 Group Relative Policy Optimization 策略進行微調，生成邏輯連貫的響應。

多語言支持

支持越南語、英語、中文、印尼語和泰語等多種語言。

模型能力

文本生成

邏輯推理

多語言處理

使用案例

教育

數學問題解答

解答數學問題，如雞兔同籠問題。

能夠正確解答並展示推理過程。

自然科學問題解答

解答自然科學相關的問題。

能夠提供邏輯連貫的答案。

社會科學

社會科學問題解答

解答社會科學相關的問題。

能夠提供邏輯連貫的答案。

🚀 GreenMind-Medium-14B-R1

我們發佈了 GreenMind-Medium-14B-R1，這是一箇中等規模的越南語模型，能夠有效解決需要中級推理的問題，例如常識、數學、自然科學和社會科學等領域的問題。通過採用分組相對策略優化（Group Relative Policy Optimization）策略進行微調，我們引導模型生成邏輯連貫的響應。

🚀 快速開始

這裡提供了一個使用 apply_chat_template 的代碼片段，向你展示如何加載分詞器和模型，以及如何生成內容。

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "GreenNode/GreenMind-Medium-14B-R1"

model = AutoModelForCausalLM.from_pretrained(
	model_name,
	torch_dtype="auto",
	device_map="auto"
)

tokenizer = AutoTokenizer.from_pretrained(
	model_name,
	revision='main',
	trust_remote_code=False,
)
prompt = r"""Vừa gà vừa chó
Bó lại cho tròn
Ba mươi sáu con
Một trăm chân chẵn
Hỏi có bao nhiêu con gà, bao nhiêu con chó?"""

messages = [
	{
	"role": "system",
	"content": "Bạn là một trợ lý ảo hữu ích trong việc trả lời câu hỏi. Hãy suy luận từng bước, và đưa ra đáp án trong thẻ <answer> </answer>."
	},
	{
	"role": "user",
	"content": f"{prompt} Hãy suy luận từng bước trong thẻ <think> </think>. Và trả về đáp án trong thẻ <answer> </answer>."
	},
	{
	"role": "assistant",
	"content": "Hãy để tôi giải quyết từng bước.\n<think>"
	}
]

text = tokenizer.apply_chat_template(
	messages, 
	tokenize=False, 
	continue_final_message=True)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=1024
)

generated_ids = [
output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)
# Đầu tiên, chúng ta cần thiết lập hai phương trình dựa trên thông tin đề bài:
# 1. Tổng số con gà và chó là 36: x + y = 36
# 2. Tổng số chân là 100: 2x + 4y = 100
# Trong đó, x là số con gà và y là số con chó.
# Tiếp theo, chúng ta giải hệ phương trình này:
# Từ phương trình thứ nhất, ta có: x = 36 - y
# Thay vào phương trình thứ hai: 2(36 - y) + 4y = 100
# => 72 - 2y + 4y = 100
# => 2y = 28
# => y = 14 (số con chó)
# Thay y = 14 vào phương trình x + y = 36:
# => x = 36 - 14 = 22 (số con gà)
# Vậy, có 22 con gà và 14 con chó.
# </think>
# <answer>Có 22 con gà và 14 con chó.</answer>

✨ 主要特性

模型類型：自迴歸語言模型
基礎模型：Qwen/Qwen2.5-14B-Instruct
參數數量：147億
上下文長度：完整131,072個詞元，生成8192個詞元
支持語言：越南語

📚 詳細文檔

評估

SeaExam數據集

模型	SeaExam-ID	SeaExam-TH	SeaExam-VI	平均分
Meta-Llama-3.1-70B-Instruct	65.8	70.6	72.6	69.7
gemma3-27b-it	64.4	67.5	73.1	68.4
Qwen2.5-14B-Instruct	67.6	68.8	73.1	69.8
GreenMind-Medium-14B-R1	74.36	69.75	74.44	72.79

VLSP 2023挑戰賽

模型	ComprehensionQA-vi ↑	Exams-vi ↑	LAMBADA-vi ↓	WikiQA-vi ↑	MMLU-vi ↑
cpt-smartbot-13b	0.6633	0.3473	21.9864	0.4455	0.414
ura-llama-13b	0.6556	0.342	17.5614	0.438	0.3973
greennode-7b (先前工作)	0.6122	0.2892	189.7782	0.3335	0.387
greennode-14b (先前工作)	0.6711	0.3672	29.5967	0.468	0.5281
GreenMind-Medium-14B-R1 (我們的模型)	0.8689	0.7796	10.7609	0.7915	0.7124

VMLU數據集

模型	Access	STEM	Social Science	Humanities	Others	平均分
VNPTAI.IO-Medium-R1	私有	77.09	82.3	78.85	69.98	77.43
MISA-Llama3-v1.1	私有	77.5	80.75	76.62	71.6	76.87
BnK-AI-Medium-v2	私有	80.94	80.76	70.7	74.06	76.66
VNPTAI.IO-Large-v4	私有	78.05	79.05	75.39	70.37	76.21
GreenNode-xMedium-v1	私有	75.7	81.09	75.25	69.33	75.5
GreenMind-Medium-14B-R1 (我們的模型)	權重	76.78	77.36	72.32	69.03	74.29
CakebyVPBank-Large	私有	77.75	78.11	70.38	67.82	73.99
DeepSeek-R1-Distill-Llama-70B	權重	76.77	76.23	67.98	66.82	72.41

🔗 關注我們

https://x.com/greennode23

💬 支持

https://discord.gg/B6MJFM3J3a

📄 許可證

本倉庫和模型權重遵循 MIT許可證。

📖 引用

如果您認為我們的工作有幫助，請引用我們的成果。

@misc{tung2025greenmindnextgenerationvietnameselarge,
      title={GreenMind: A Next-Generation Vietnamese Large Language Model for Structured and Logical Reasoning}, 
      author={Luu Quy Tung and Hoang Quoc Viet and Vo Trong Thu},
      year={2025},
      eprint={2504.16832},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2504.16832}, 
}