Qwen3-4B-rpg-roleplay開源角色扮演對話模型 - 生成貼合角色的連貫對白

首頁

Qwen3 4B Rpg Roleplay

由Chun121開發

基於千問3-4B模型微調的角色扮演對話模型，擅長生成符合角色特徵的連貫對話

大型語言模型英語開源協議:Apache-2.0 #角色對話微調 #LoRA高效適配 #奇幻RPG專用

下載量 1,657

發布時間 : 4/30/2025

模型概述

該模型通過LoRA微調技術優化了角色對話生成能力，特別適合用於遊戲、互動敘事等需要角色驅動的場景。

模型特點

角色一致性保持

能夠生成符合角色特徵的對話，保持人設一致性

情境感知對話

根據場景上下文生成身臨其境的敘事回應

高效微調技術

採用LoRA微調和4比特量化技術，實現高效訓練

多格式支持

提供4比特(bnb)、GGUF等多種量化格式選擇

模型能力

角色對話生成

劇情互動

多輪對話維持

情感語境響應

使用案例

遊戲開發

NPC對話系統

為遊戲中的非玩家角色生成個性鮮明的對話

提升遊戲沉浸感和角色真實感

互動敘事

角色驅動型故事

創建基於角色互動的動態敘事體驗

增強用戶參與度和故事可變性

🚀 Qwen3-4B角色扮演LoRA

讓角色在對話中鮮活起來

用自然、引人入勝的對話賦予你的數字夥伴生命

🚀 快速開始

Hugging Face Transformers

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# Load model with 4-bit quantization for efficiency
tokenizer = AutoTokenizer.from_pretrained("chun121/qwen3-4b-roleplay-lora")
model = AutoModelForCausalLM.from_pretrained(
    "chun121/qwen3-4b-roleplay-lora",
    torch_dtype=torch.float16,  # Use float16 for faster inference
    device_map="auto"           # Automatically choose best device
)

# Create a character-focused prompt
character_prompt = """
Character: Elara, an elven mage with centuries of knowledge but little patience for novices
Setting: The Grand Library of Mystral
Context: A young apprentice has asked for help with a difficult spell

User: Excuse me, I'm having trouble with the fire conjuration spell. Could you help me?

Elara:
"""

# Generate response
inputs = tokenizer(character_prompt, return_tensors="pt").to(model.device)
outputs = model.generate(
    inputs["input_ids"],
    max_new_tokens=200,
    temperature=0.7,
    top_p=0.9,
    do_sample=True
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

使用GGUF模型

如果你正在使用帶有llama.cpp的GGUF導出文件：

# Example command for Q4_K_M quantization
./llama -m chun121-qwen3-4b-roleplay-lora.Q4_K_M.gguf -p "Character: Elara, an elven mage..." -n 200

✨ 主要特性

歡迎，各位創作者！我是Chun（@chun121），我對令人印象深刻的Qwen3 - 4B模型進行了微調，使其在基於角色的對話和角色扮演場景中表現出色。無論你是在製作沉浸式遊戲、構建交互式講故事平臺，還是開發以角色為驅動的人工智能體驗，這個模型都將幫助你的角色說話時展現出個性、連貫性和深度。

這個LoRA適配版本在保持基礎模型智能的同時，增強了以下能力：

保持一致的角色人設
生成反映角色特徵的真實對話
創建沉浸式的敘事回覆
在整個對話中記住上下文

📦 安裝指南

文檔中未提及安裝步驟，故跳過此章節。

💻 使用示例

基礎用法

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# Load model with 4-bit quantization for efficiency
tokenizer = AutoTokenizer.from_pretrained("chun121/qwen3-4b-roleplay-lora")
model = AutoModelForCausalLM.from_pretrained(
    "chun121/qwen3-4b-roleplay-lora",
    torch_dtype=torch.float16,  # Use float16 for faster inference
    device_map="auto"           # Automatically choose best device
)

# Create a character-focused prompt
character_prompt = """
Character: Elara, an elven mage with centuries of knowledge but little patience for novices
Setting: The Grand Library of Mystral
Context: A young apprentice has asked for help with a difficult spell

User: Excuse me, I'm having trouble with the fire conjuration spell. Could you help me?

Elara:
"""

# Generate response
inputs = tokenizer(character_prompt, return_tensors="pt").to(model.device)
outputs = model.generate(
    inputs["input_ids"],
    max_new_tokens=200,
    temperature=0.7,
    top_p=0.9,
    do_sample=True
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

高級用法

# Example command for Q4_K_M quantization
./llama -m chun121-qwen3-4b-roleplay-lora.Q4_K_M.gguf -p "Character: Elara, an elven mage..." -n 200

📚 詳細文檔

侷限性

上下文窗口限制為512個標記。
在非常長的對話中偶爾可能會“忘記”角色特徵。
訓練數據集主要集中在奇幻/RPG情境。
作為LoRA微調模型，繼承了基礎Qwen3 - 4B模型的侷限性。

致謝

特別感謝：

Qwen團隊提供了出色的基礎模型。
PJMixers - Dev提供了高質量的數據集。
Unsloth團隊讓高效微調變得可行。
HuggingFace社區的持續支持。

反饋與聯繫

我很想了解這個模型在你的項目中的使用情況！歡迎：

在HuggingFace倉庫中提出問題。
在HuggingFace上與我聯繫 @chun121。
分享你使用此模型創建的角色示例。

🔧 技術細節

屬性	詳情
基礎模型	Qwen3-4B
架構	基於Transformer的大語言模型，採用LoRA適配
參數數量	40億（基礎模型）+ LoRA參數
量化選項	4位（bnb），GGUF格式（Q8_0、F16、Q4_K_M）
訓練框架	Unsloth & TRL
上下文長度	512個標記
開發者	Chun
許可證	Apache 2.0

這個LoRA模型是在免費的Google Colab T4 GPU上使用高效量化技術進行訓練的，以充分利用有限的資源：

數據集：PJMixers-Dev/Gryphe-Aesir-RPG-Charcards-Opus-Mixed-split
LoRA配置：
- 秩：16
- 阿爾法：32
- 目標模塊：針對角色對話生成進行了優化
訓練超參數：
- 批量大小：8
- 梯度累積步數：4
- 學習率：使用餘弦調度器，學習率為1e - 4
- 最大步數：200
- 精度：FP16/BF16（自動檢測）
- 打包：啟用以實現高效訓練
- QLoRA：通過bitsandbytes進行4位量化