wanabi_mini_12b_GGUFオープンソース言語モデル - 無料で日本語小説のアイデア生成と本文の続き書きをサポート

ホーム

Wanabi Mini 12b GGUF

kawaimasaによって開発

日本語小説創作に最適化された軽量大規模言語モデル、Mistralアーキテクチャベースで、アイデア生成や本文続きの執筆機能を提供

大規模言語モデル日本語オープンソースライセンス:Apache-2.0 #日本語小説創作 #軽量化Mistral #クリエイティブ補完生成

ダウンロード数 200

リリース時間 : 5/23/2025

モデル概要

日本語小説創作シーン向けに最適化された言語モデルで、wanabi-24Bのコア機能を維持しつつより軽量化されたバージョン。インスピレーションの構想から本文生成までの全プロセスをサポート

モデル特徴

クリエイティブ補完機能

完全な小説要素が入力されると、より深い創作提案とインスピレーションの拡張を自動生成

作者ノート機能

続きのプロットを記述することで、続きの内容生成を精密にガイド

コンテンツレーティング制御

general/r18の2段階のコンテンツレーティング設定をサポート

会話量調整

生成テキストの会話比率を6段階で調整（テスト段階の機能）

高品質トレーニングデータ

厳選された日本語小説関連のテキストデータを使用してトレーニング

モデル能力

小説本文生成

文脈に沿った続きの執筆

クリエイティブなインスピレーション生成

世界観設定の拡張

キャラクター詳細の補完

使用事例

文学創作

小説の下書き生成

キーワード/あらすじに基づいて完全な小説の章を自動生成

設定スタイルに合った下書きを迅速に作成

プロットの続き執筆

既存の章に基づいて一貫性のある続きの内容を自動生成

スタイルの一貫性を保ちつつ物語を展開

クリエイティブ刺激

断片的な情報から完全な小説設定を生成

キャラクター/世界観/プロットなど多面的な創作提案を提供

🚀 wanabi_mini_12b_GGUF

wanabi_mini_12b_GGUF は、小説執筆支援に特化した日本語大規模言語モデルです。wanabi - 24B と同等の機能を備え、より多くのユーザーが扱いやすいように設計されています。このモデルは、高品質な日本語の小説関連テキストデータを用いて学習され、アイデア出しから本文生成、文脈に沿った続きの生成、そしてアイデアの補間まで、小説執筆の様々なプロセスをサポートします。

🚀 クイックスタート

このモデルは、専用のデスクトップアプリケーション Project Wannabe と連携して使用することを強く推奨します。Project Wannabe は、wanabi_mini_12b_GGUF の能力を最大限に引き出すための GUI を提供し、以下で説明する機能を直感的に利用できるように設計されています。

✨ 主な機能

新機能 (wanabi - 24B v1 との比較)

wanabi_mini_12b_GGUF は、24B版の主要機能に加え、以下の新機能が追加されています。

アイデア補間機能 (新):
- 目的: Project Wannabe の「詳細情報」タブで、小説のアイデアに必要な全ての項目（タイトル、キーワード、ジャンル、あらすじ、設定、プロット）が入力されている場合に、それらの情報を基により詳細で深掘りされたアイデアや展開のヒントを生成します。
- 適用: アイデア生成 (IDEA) タスクにおいて、特定の条件を満たした際に起動します。

基本的な小説執筆支援機能

wanabi - 24B と同様の基本的な小説執筆支援機能を提供します。

オーサーズノート機能:
- 目的: 次に起きる展開、行動、心情描写など、今後おおよそ1000文字以内に起こるような直近の内容を記述することで、続きの文章生成をより細かく誘導します。
- 適用: 続き生成 (CONT) タスクのプロンプトに組み込まれます。
レーティング機能:
- 目的: 生成内容のレーティング（general または r18）を指定します。
- 適用: 全てのタスク (GEN, CONT, IDEA) の指示 (Instruction) の末尾に レーティング: {指定値} が付与されます。
セリフ量指定機能:
- 目的: 生成される文章中のセリフの割合を「指定なし」「少ない」「やや少ない」「普通」「やや多い」「多い」から選択します。（現在のバージョンではまだ完全に反映されませんが、将来のバージョンでの対応を見据えた機能です。）
- 適用: 「指定なし」以外が選択された場合、本文生成 (GEN) および続き生成 (CONT) タスクのプロンプトの入力 (Input) 部分（参考情報ブロック内）に # セリフ量: {指定値} が含まれます。
本文生成 (GEN):
- 指示に加え、任意で与えられるメタデータ（タイトル、キーワード、ジャンル、あらすじ、設定、プロット）や セリフ量、レーティングに基づいて小説本文を生成します。
続き生成 (CONT):
- 与えられた本文の続きを、任意で与えられるメタデータ、セリフ量、レーティング、そして オーサーズノート を考慮しながら生成します。
- プロンプト構造は wanabi - 24B v0.1 と同様の改善された形式です。
アイデア生成 (IDEA):
- 任意で与えられるメタデータの一部（または無し）と レーティング を基に、小説のアイデア（タイトル、キーワード、ジャンル、あらすじ、設定、プロット）を生成します。
- アイデア補間機能により、入力情報が豊富な場合はより詳細なアイデアが生成されます。

🔧 技術詳細

ベースモデル

[mistralai/Mistral - Nemo - Base - 2407](https://huggingface.co/mistralai/Mistral - Nemo - Base - 2407)

学習フレームワーク

[LLaMA - Factory](https://github.com/hiyouga/LLaMA - Factory)

学習手法

手法: Supervised Fine - tuning (SFT)
量子化・アダプター: LoRA
- lora_rank: 128
- lora_alpha: 256
- lora_dropout: 0.05
- lora_target: all (全ての線形層)
精度: bf16
シーケンス長: 32768
バッチサイズ: per_device_train_batch_size = 1, gradient_accumulation_steps = 24 (実効バッチサイズ 24)
最適化:
- Optimizer: PagedAdamW (8 - bit) (optim: paged_adamw_8bit)
- Flash Attention 2: 有効 (flash_attn: fa2)
- Unsloth Gradient Checkpointing: 有効 (use_unsloth_gc: true)
- Liger Kernel: 有効 (enable_liger_kernel: true)
- Weight Decay: 0.01 (weight_decay: 0.01)
学習率:
- learning_rate: 4.0e - 5
- lr_scheduler_type: cosine_with_restarts
- lr_scheduler_kwargs: {"num_cycles": 1}
- warmup_ratio: 0.03
その他:
- num_train_epochs: 1

📚 ドキュメント

プロンプト形式 (`mistral_small` テンプレート)

本モデルは LLaMA - Factory の mistral_small チャットテンプレート形式で学習されています。推論時も同様の形式を推奨します。Project Wannabe を使用する場合は、意識する必要はありません。 wanabi - 24B と基本的な形式は同じなため、詳細は省略します。

新機能:アイデア補間:

Project Wannabe の「詳細情報」タブで、タイトル、キーワード、ジャンル、あらすじ、設定、プロットの全てが入力されている状態でアイデア生成を実行すると、モデルはこれらの豊富な情報を活用し、より詳細で具体的なアイデア（例えば、キャラクターの掘り下げ、サブプロットの提案、世界観の補足説明など）を生成しようと試みます。この機能は特別なプロンプト変更を必要とせず、入力情報の量と質に応じて自動的に働きが変化します。

⚠️ 制限事項と注意点

⚠️ 重要提示

本モデルは現在も開発途上であり、性能や安定性は今後のバージョンで向上する可能性があります。

学習データの特性上、生成内容が特定のジャンル、表現、展開に偏る可能性があります。

学習データには多様なテキストが含まれるため、不快感を与える可能性のある文章が生成されることがあります。レーティング機能で制御を試みていますが、完全ではありません。

生成される文章の多様性、一貫性、文脈への追従性には限界があります。

本モデルは研究および実験的な目的で提供されています。違法な目的や他者の権利を侵害する目的での使用は固く禁じます。

本モデルの使用によって生じたいかなる結果についても、開発者は一切の責任を負いません。