ABEJA-Qwen2.5-7b-Japanese-v0.1開源模型 - 提升日語指令跟隨性能，免費可用

首頁

ABEJA Qwen2.5 7b Japanese V0.1

由abeja開發

基於Qwen/Qwen2.5-7B-Instruct進行日語訓練的模型，通過蒸餾學習實現，提升了指令跟隨性能。

大型語言模型

Transformers

日語開源協議:Apache-2.0 #日語指令優化 #知識蒸餾增強 #差分向量調優

下載量 521

發布時間 : 3/12/2025

模型概述

該模型是在Qwen/Qwen2.5-7B-Instruct基礎上進行日語訓練的模型，通過ChatVector提升了指令跟隨性能，適用於日語文本生成任務。

模型特點

蒸餾學習實現

與常規的持續預訓練不同，該模型是在abeja/ABEJA-Qwen2.5-32b-日語-v0.1的基礎上通過蒸餾學習實現的。

指令跟隨性能提升

通過ChatVector（Qwen/Qwen2.5-7B-Instruct與Qwen/Qwen2.5-7B的差分向量）提升了指令跟隨性能。

模型能力

日語文本生成

指令跟隨

使用案例

自然語言處理

日語對話系統

用於構建日語對話系統，提供自然流暢的對話體驗。

日語文本生成

生成高質量的日語文本，適用於內容創作、翻譯輔助等場景。

🚀 ABEJA-Qwen2.5-7b-Japanese-v0.1

ABEJA-Qwen2.5-7b-Japanese-v0.1 是基於 Qwen/Qwen2.5-7B-Instruct 進行日語學習的模型。該模型並非採用常規的持續預訓練方式，而是以 abeja/ABEJA-Qwen2.5-32b-Japanese-v0.1 為基礎進行蒸餾學習得到的。此外，該模型未進行後訓練（Post-Traning），而是通過 ChatVector（Qwen/Qwen2.5-7B-Instruct 與 Qwen/Qwen2.5-7B 的差分向量）提升了指令跟隨性能。

如需瞭解更多詳細信息，請參考 ABEJA 的技術博客。

🚀 快速開始

如需瞭解更多詳細信息，請參考 ABEJA 的技術博客。

💻 使用示例

基礎用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "abeja/ABEJA-Qwen2.5-7b-Japanese-v0.1"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "人とAIが協調するためには？"
messages = [
    {"role": "system", "content": "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

print(response)

📄 許可證

本項目採用 Apache-2.0 許可證。

👨‍💻 開發者

Hiroshi Kiyota
Keisuke Fujimoto
Kentaro Nakanishi
Kyo Hattori
Shinya Otani
Shogo Muranushi
Takuma Kume
Tomoki Manabe

（*按字母順序排列）

📋 模型信息

屬性	詳情
模型類型	文本生成
基礎模型	Qwen/Qwen2.5-7B-Instruct
學習方式	基於 abeja/ABEJA-Qwen2.5-32b-Japanese-v0.1 進行蒸餾學習
指令跟隨性能提升方式	通過 ChatVector（Qwen/Qwen2.5-7B-Instruct 與 Qwen/Qwen2.5-7B 的差分向量）