首頁

Wanabi 24b Preview Gguf

由kawaimasa開發

專為日語小說創作輔助而微調的大規模語言模型預覽版本

大型語言模型日語開源協議:Apache-2.0 #日語小說創作 #長文本生成 #異世界題材

下載量 148

發布時間 : 4/23/2025

模型概述

基於Mistral-Small-24B-Base-2501進行微調，擅長小說構思、基於設定的正文生成和上下文連貫的續寫任務

模型特點

小說創作專用

針對日語小說創作進行優化，特別擅長構思生成、正文創作和續寫

長上下文支持

支持長達32768 tokens的上下文長度，適合長篇小說創作

多任務支持

可處理構思生成、正文創作和續寫三種主要小說創作任務

Project Wannabe集成

與專用GUI應用程序Project Wannabe深度集成，提供更好的創作體驗

模型能力

小說構思生成

基於設定的正文生成

上下文連貫的續寫

自由創作

元數據處理

使用案例

文學創作

小說構思

根據關鍵詞或部分設定生成完整的小說構思

生成包含標題、關鍵詞、類型、梗概、設定和情節的完整構思

正文創作

根據給定的元數據生成小說正文

生成符合設定和風格的連貫小說正文

續寫創作

根據已有正文和設定進行續寫

生成上下文連貫、風格一致的續寫內容

🚀 wanabi-24B (預覽版)

wanabi-24B 是一款專門為小說寫作輔助進行微調的大規模語言模型的 預覽版。該模型基於 mistralai/Mistral-Small-24B-Base-2501，使用日語小說相關文本數據進行訓練。尤其擅長小說創意構思、根據設定生成正文以及按照上下文續寫等任務。

🚀 快速開始

此模型強烈建議與專用桌面應用程序 Project Wannabe 配合使用。Project Wannabe 提供了一個圖形用戶界面（GUI），可充分發揮 wanabi-24B 的能力，無縫支持從創意生成到正文寫作以及持續生成（無限生成）等功能。使用 Project Wannabe 時，用戶無需關注下文所述的提示詞格式，即可輕鬆利用模型的各項功能。

✨ 主要特性

專注小說創作：針對小說寫作的特定需求進行微調，在小說創意構思、正文生成和續寫等方面表現出色。
基於強大基礎模型：以 mistralai/Mistral-Small-24B-Base-2501 為基礎，繼承了其廣泛的知識和強大的語言理解能力。

📦 安裝指南

文檔未提及安裝步驟，故跳過此章節。

💻 使用示例

基礎用法

以下是不同任務的提示詞格式示例：

本文生成 (GEN)

有元數據的格式示例：

<s>[INST] 請根據以下信息生成小說正文。

# 標題:
異世界轉生後成了野狗這件事

# 關鍵詞:
異世界轉生
狗 [/INST] {生成的正文} </s>

無元數據的格式示例：

<s>[INST] 請自由生成一篇小說。 [/INST] {生成的正文} </s>

續文生成 (CONT)

有元數據的格式示例：

<s>[INST] 請根據參考信息續寫以下文章。

【正文】

原以為被路人刺死了，沒想到轉生到異世界成了野狗。

【參考信息】

標題:

異世界轉生後成了野狗這件事

關鍵詞:

異世界轉生狗放逐

無元數據的格式示例：

<s>[INST] 請續寫以下文章。

【正文】

原以為被路人刺死了，沒想到轉生到異世界成了野狗。

創意生成 (IDEA)

部分有元數據的格式示例：

<s>[INST] 請根據以下信息生成一個完整的小說創意（標題、關鍵詞、體裁、梗概、設定、情節）。

# 關鍵詞:
異世界轉生
狗 [/INST] # 標題:
異世界轉生後成了野狗這件事

# 關鍵詞:
異世界轉生
狗
放逐
戀愛
NTR

# 體裁:
異世界幻想
低魔幻想

# 梗概:
原以為被路人刺死了，沒想到轉生到異世界成了野狗。起初絕望無比，但被善良的少女收留...

# 設定:
故事背景是一個劍與魔法的中世紀風格異世界。主人公擁有現代知識，卻被困在狗的身體裡。

# 情節:
與少女相遇 -> 城裡的騷亂 -> 主人公特殊能力覺醒 -> 面臨放逐危機 -> ... </s>

無元數據的格式示例：

<s>[INST] 請自由生成一個小說創意（標題、關鍵詞、體裁、梗概、設定、情節）。 [/INST] {生成的完整創意} </s>

高級用法

在推理時，建議使用與訓練時相同的 mistral_small 模板格式 (<s>[INST] {指令} {輸入} [/INST] {輸出} </s>)，以獲得更好的生成效果。

📚 詳細文檔

訓練詳情

基礎模型

mistralai/Mistral-Small-24B-Base-2501
- （訓練時使用 unsloth/Mistral-Small-24B-Base-2501-bnb-4bit）

訓練框架

LLaMA-Factory

訓練方法

QLoRA (4-bit)
- lora_rank: 128
- lora_alpha: 256
- lora_dropout: 0
- lora_target: all（所有線性層）
精度：bf16
優化：
- PagedAdamW (8-bit)
- Flash Attention 2
- Unsloth Gradient Checkpointing (use_unsloth_gc: true)
- Liger Kernel (enable_liger_kernel: true)
訓練參數：
- learning_rate: 3.0e-5
- lr_scheduler_type: cosine_with_restarts (num_cycles: 5)
- warmup_ratio: 0.03
其他：
- cutoff_len: 32768
- per_device_train_batch_size: 1
- gradient_accumulation_steps: 24