🚀 wanabi-24B (preview)
wanabi-24B は、小説執筆支援に特化してファインチューニングされた大規模言語モデルの プレビュー版 (preview) です。このモデルは、日本語の小説関連テキストデータを用いて学習され、小説のアイデア出しや本文生成などのタスクを得意とします。
🚀 クイックスタート
このモデルは、専用のデスクトップアプリケーション Project Wannabe と連携して使用することを強く推奨します。Project Wannabe は、wanabi-24B の能力を最大限に引き出すための GUI を提供し、アイデア生成から本文執筆、継続生成(無限生成)までをシームレスにサポートします。Project Wannabe を使用することで、プロンプト形式を意識することなく、モデルの機能を活用できます。
✨ 主な機能
- 小説のアイデア出し、設定に基づいた本文生成、文脈に沿った続きの生成が得意です。
- 日本語の小説関連テキストデータを用いて学習されています。
📦 インストール
現在、GGUF (Q4_K_M) 形式のみ提供しています。
💻 使用例
基本的な使用法
学習時には mistral_small
テンプレート形式を使用しました。推論時も同様の形式 (<s>[INST] {instruction} {input} [/INST] {output} </s>
) を推奨します。以下は具体的な形式例です。
本文生成 (GEN)
<s>[INST] 以下の情報に基づいて小説本文を生成してください。
# タイトル:
異世界転生したら野良犬だった件
# キーワード:
異世界転生
犬 [/INST] {生成される本文} </s>
<s>[INST] 自由に小説を生成してください。 [/INST] {生成される本文} </s>
続き生成 (CONT)
<s>[INST] 参考情報を基に以下の文章の続きを生成してください。
【本文】
通り魔に刺されて死んだと思ったら、異世界で野良犬に転生していた。
【参考情報】
タイトル:
異世界転生したら野良犬だった件
キーワード:
異世界転生
犬
追放
<s>[INST] 以下の文章の続きを生成してください。
【本文】
通り魔に刺されて死んだと思ったら、異世界で野良犬に転生していた。
アイデア生成 (IDEA)
<s>[INST] 以下の情報に基づいて、完全な小説のアイデア(タイトル、キーワード、ジャンル、あらすじ、設定、プロット)を生成してください。
# キーワード:
異世界転生
犬 [/INST] # タイトル:
異世界転生したら野良犬だった件
# キーワード:
異世界転生
犬
追放
恋愛
NTR
# ジャンル:
異世界ファンタジー
ローファンタジー
# あらすじ:
通り魔に刺されて死んだと思ったら、異世界で野良犬に転生していた。最初は絶望していたが、優しい少女に拾われ...
# 設定:
舞台は剣と魔法の中世風異世界。主人公は現代知識を持つが犬の体に囚われている。
# プロット:
少女との出会い -> 街での騒動 -> 主人公の特殊能力覚醒 -> 追放の危機 -> ... </s>
<s>[INST] 自由に小説のアイデア(タイトル、キーワード、ジャンル、あらすじ、設定、プロット)を生成してください。 [/INST] {生成されるアイデア一式} </s>
📚 ドキュメント
ベースモデル
学習フレームワーク
学習手法
- QLoRA (4-bit)
lora_rank
: 128
lora_alpha
: 256
lora_dropout
: 0
lora_target
: all (全ての線形層)
- 精度: bf16
- 最適化:
- PagedAdamW (8-bit)
- Flash Attention 2
- Unsloth Gradient Checkpointing (
use_unsloth_gc: true
)
- Liger Kernel (
enable_liger_kernel: true
)
- 学習パラメータ:
learning_rate
: 3.0e-5
lr_scheduler_type
: cosine_with_restarts (num_cycles: 5)
warmup_ratio
: 0.03
- その他:
cutoff_len
: 32768
per_device_train_batch_size
: 1
gradient_accumulation_steps
: 24
学習データとタスク
日本語の小説関連テキストデータを用いて、以下の3つの主要なタスク形式で Instruction Tuning (SFT) を行いました。
- 本文生成 (GEN): 指示と任意で与えられるメタデータに基づいて小説本文を生成します。
- 続き生成 (CONT): 与えられた本文の続きを、任意で与えられるメタデータを参考にしながら生成します。
- アイデア生成 (IDEA): 任意で与えられるメタデータの一部(または無し)から、完全な小説のアイデアを生成します。
🔧 技術詳細
本モデルは、ベースモデルとして mistralai/Mistral-Small-24B-Base-2501 を使用し、日本語の小説関連テキストデータを用いて学習されています。学習手法としては、QLoRA (4-bit) を採用し、精度は bf16 です。最適化には、PagedAdamW (8-bit)、Flash Attention 2、Unsloth Gradient Checkpointing、Liger Kernel を使用しています。
📄 ライセンス
license: apache-2.0 # ベースモデルに準拠 (仮) - 必要に応じて変更してください
⚠️ 重要提示
- 本モデルは開発中のpreview版であり、性能や安定性は保証されません。
- 学習データの特性上、生成内容が特定のジャンル、表現、展開に偏る可能性があります。
- 学習データには多様なテキストが含まれるため、未成年者の閲覧に適さない、または不快感を与える可能性のある文章が生成されることがあります。
- 生成される文章の多様性、一貫性、文脈への追従性には限界があります。特に長い文章の生成では破綻する可能性があります。
- 本モデルは研究および実験的な目的で提供されています。利用者は、適用される法律および規制を遵守する責任を負います。違法な目的や他者の権利を侵害する目的での使用は固く禁じます。
- 本モデルの使用によって生じたいかなる結果についても、開発者は一切の責任を負いません。全て自己責任においてご利用ください。
💡 使用建议
- preview版からの追加学習版は廃止され、preview_plusが同データセットの最後のモデルです。
- 現在、レーティング、セリフ量、オーサーズノートに対応したデータセットで学習中です。
- wanabi-24B vX: 拡張データセットによる SFT を実施中 (順次公開)
(ロードマップは変更される可能性があります)