MN - SlushオープンソースAIモデル - 無料でデプロイ可能、創造力とロールプレイ能力を強力に向上

ホーム

MN Slush

crestf411によって開発

Slushは高LoRAドロップアウト率トレーニングを採用した二段階モデルで、創造力とロールプレイ能力の向上に焦点を当てています

大規模言語モデル

Transformers

#高LoRAドロップアウト率トレーニング #ロールプレイ最適化 #長文コンテキストサポート

ダウンロード数 59

リリース時間 : 11/20/2024

モデル概要

Slushは特別なトレーニングを施した大規模言語モデルで、二段階トレーニング手法を採用しています。最初の段階では基礎モデルの事前学習を継続し創造力とライティング能力を向上させ、第二段階ではロールプレイ能力を強化するためにファインチューニングを行います。このモデルは全年齢向けではなく、特にロールプレイシナリオに適しています。

モデル特徴

二段階トレーニング

事前学習継続とファインチューニングの二段階を採用し、それぞれ創造力とロールプレイ能力を向上させます

高LoRAドロップアウト率

トレーニングで0.5のLoRAドロップアウト率を採用し、最新の研究成果に基づいてモデル性能を最適化します

長文コンテキストサポート

16384トークンの長文コンテキスト処理能力をサポートします

LoRA+技術

LoRA+トレーニング手法を採用し、学習率比率15でトレーニング効果を最適化します

モデル能力

クリエイティブライティング

ロールプレイ対話

長文生成

指示追従

使用事例

エンターテインメント

ロールプレイゲーム

ゲーム内のキャラクターとしてユーザーと没入型のインタラクションを行います

高品質なロールプレイ体験を提供します

クリエイティブライティング支援

ユーザーがクリエイティブなストーリーや小説コンテンツを生成するのを支援します

創造性豊かなテキスト出力を生成します

対話システム

パーソナライズドチャットボット

特定の性格特性を持つチャットボットを構築します

個性的で一貫性のある対話体験を提供します

🚀 Slush

Slushは、高いLoRAドロップアウトを用いて2段階で学習されたモデルです。第1段階ではベースモデルの事前学習を継続し、モデルの創造性と文章生成能力を向上させます。その後、これを命令調整モデルにマージし、第2段階ではロールプレイ能力をさらに強化したり、第1段階のマージで生じた不具合を修正したりするための微調整を行います。

このモデルはまだ初期段階です。いつも通り、フィードバックは大歓迎ですが、完璧を要求する方はご遠慮ください。

第2段階は、Sunfallシリーズと同様に、Silly Tavernのプリセット（Mistral V2 & V3、ただしV3-Tekkenも問題なく動作します）に従っています。したがって、他のツールやプリセットを使用する場合は、結果が異なる可能性があります。

🚀 クイックスタート

このモデルの使用に関する基本的な情報を以下に示します。

(GGUFs)

✨ 主な機能

高いLoRAドロップアウトを用いた2段階学習により、創造性と文章生成能力が向上しています。
ロールプレイ能力が強化されています。
第1段階のマージで生じた不具合を修正する機能も備えています。

🔧 技術詳細

パラメータの提案

私はすべてのテストをtemp 1、min-p 0.1、DRY 0.8で行いました。

学習の詳細

第1段階（事前学習の継続）
- 対象: mistralai/Mistral-Nemo-Base-2407（結果として得られたLoRAをmistralai/Mistral-Nemo-Instruct-2407にマージ）
- LoRAドロップアウト 0.5 (動機)
- LoRAランク 64、アルファ 128 (動機)
- LRコサイン 4e-6
- LoRA+ 、LR比率: 15
- コンテキストサイズ: 16384
- 勾配累積ステップ: 4
- エポック数: 1
第2段階（微調整）
- 対象: 第1段階のモデル
- LoRAドロップアウト 0.5
- LoRAランク 32、アルファ 64
- LRコサイン 5e-6（最小 5e-7）
- LoRA+ 、LR比率: 15
- コンテキストサイズ: 16384
- 勾配累積ステップ: 4
- エポック数: 2

マージの詳細

マージ方法

このモデルは、TIESマージ方法を使用し、mistralai/Mistral-Nemo-Base-2407をベースにマージされました。

設定

このモデルを生成するために使用されたYAML設定は以下の通りです。

models:
  - model: stage1-on-instruct
    parameters:
      weight: 1
      density: 1
  - model: stage2-on-stage1
    parameters:
      weight: 0.7
      density: 1
  - model: mistralai/Mistral-Nemo-Instruct-2407
    parameters:
      weight: 1
      density: 1
merge_method: ties
base_model: mistralai/Mistral-Nemo-Base-2407
parameters:
  weight: 1
  density: 1
  normalize: true
  int8_mask: true
tokenizer_source: mistralai/Mistral-Nemo-Instruct-2407
dtype: bfloat16

情報テーブル

属性	详情
ライブラリ名	transformers
タグ	not-for-all-audiences、mergekit
訓練データセット	crestf411/LimaRP-DS、Gryphe/Sonnet3.5-Charcard-Roleplay、anthracite-org/c2_logs_32k_mistral-v3_v1.2_no_system、anthracite-org/kalo-opus-instruct-22k-no-refusal-no-system、anthracite-org/kalo-opus-instruct-3k-filtered-no-system、anthracite-org/nopm_claude_writing_fixed
ベースモデル	mistralai/Mistral-Nemo-Instruct-2407