ELYZA-Thinking-1.0-Qwen-32Bオープンソース日本語推論モデル - 日本語の推論能力を強化し、無料で利用可能

Home

ELYZA Thinking 1.0 Qwen 32B

Developed by elyza

ELYZA-Thinking-1.0-Qwen-32BはELYZA, Incによって訓練された日本語推論モデルで、Qwen/Qwen2.5-32B-Instructをベースに後続訓練を行い、日本語の推論能力を強化しています。

大規模言語モデル

Transformers

Supports Multiple LanguagesOpen Source License:Apache-2.0 #日本語推論強化 #長い思考連鎖生成 #モンテカルロ木探索

Downloads 2,286

Release Time : 4/30/2025

Model Overview

このモデルは後続訓練により日本語での推論能力を強化し、長い思考連鎖（CoT）を含む合成データを用いて模倣学習を行い、日本語シーンでの推論ニーズに適しています。

Model Features

強力な推論能力

Qwen/Qwen2.5-32B-Instructモデルをベースに後続訓練を行い、日本語推論タスクで優れた性能を発揮します。

独特な訓練方法

モンテカルロ木探索（MCTS）アルゴリズムに基づいて生成された、長い思考連鎖（CoT）を含む合成データを用いて、模倣学習により訓練されています。

Model Capabilities

日本語テキスト生成

日本語推論タスク

長い思考連鎖推論

Use Cases

仕事と生活

仕事熱意回復の提案

仕事の熱意を回復する提案を生成する

仕事の熱意を回復する具体的な提案を5つ提供する

🚀 ELYZA-Thinking-1.0-Qwen-32B

ELYZA-Thinking-1.0-Qwen-32B は ELYZA, Inc によって訓練された推論モデルです。このモデルは Qwen/Qwen2.5-32B-Instruct をベースに訓練され、後続の訓練により日本語での推論能力が強化されています（Qwenをベースに構築）。このモデルは日本語の推論ニーズを効果的に解決し、関連するアプリケーションに強力なサポートを提供します。

ELYZA-Thinking-1.0-Qwen-32B-image

✨ 主な機能

強力な推論能力：Qwen/Qwen2.5-32B-Instruct モデルをベースに後続訓練を行い、日本語の推論タスクで優れた性能を発揮します。
独自の訓練方法：後続の訓練段階では、モンテカルロ木探索（MCTS）アルゴリズムに基づいて生成された長い思考チェーン（CoT）を含む合成データを使用し、模倣学習によって訓練されます。

💻 使用例

基本的な使用法

Hugging Face Transformers ライブラリを使用してこのモデルを利用することができます。以下は、このモデルを使用して推論を行うサンプルコードです。

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "elyza/ELYZA-Thinking-1.0-Qwen-32B"
prompt = "仕事の熱意を取り戻すためのアイデアを5つ挙げてください。"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto",
)
model.eval()
messages = [{"role": "user", "content": prompt}]
input_text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
token_ids = tokenizer.encode(
    input_text, add_special_tokens=False, return_tensors="pt"
)
with torch.no_grad():
    output_ids = model.generate(
        token_ids.to(model.device),
        max_new_tokens=8192,
        do_sample=True,
        temperature=0.6,
        top_p=0.95,
    )
output = tokenizer.decode(
    output_ids.tolist()[0][token_ids.size(1):], skip_special_tokens=True
)
print(output)

高度な使用法

デプロイには、vLLM を使用してOpenAI互換のサーバーを作成することをおすすめします。

vllm serve elyza/ELYZA-Thinking-1.0-Qwen-32B \
    --tensor-parallel-size 8 \
    --max-model-len 32768 \
    --enable-reasoning \
    --reasoning-parser deepseek_r1

⚠️ 重要な注意事項

モデルが繰り返しのループに陥るのを防ぐために、temperature を0.5から0.7の間に設定し、top_p を0.95に設定することをおすすめします。

📚 ドキュメント

モデルの説明

ELYZA-Thinking-1.0-Qwen-32B は ELYZA, Inc によって訓練された推論モデルです。Qwen/Qwen2.5-32B-Instruct をベースに、後続の訓練により日本語での推論能力が強化されています（Qwenをベースに構築）。

後続の訓練段階では、モンテカルロ木探索（MCTS）に基づくアルゴリズムによって生成された長い思考チェーン（CoT）を含む合成データを使用し、模倣学習によって訓練されます。詳細な情報については、私たちのブログ記事を参照してください。

引用情報

本モデルの引用

@misc{elyza2025thinking,
    title={elyza/ELYZA-Thinking-1.0-Qwen-32B},
    url={https://huggingface.co/elyza/ELYZA-Thinking-1.0-Qwen-32B},
    author={Masato Hirakawa and Tomoaki Nakamura and Akira Sasaki and Daisuke Oba and Shoetsu Sato},
    year={2025},
}