M

MN Slush

由crestf411開發
Slush是一個採用高LoRA丟棄率訓練的雙階段模型,專注於提升創造力和角色扮演能力
下載量 59
發布時間 : 11/20/2024

模型概述

Slush是一個經過特殊訓練的大語言模型,採用雙階段訓練方法。第一階段延續基礎模型的預訓練以提升創造力和寫作能力,第二階段進行微調以增強角色扮演能力。模型適用於非全年齡段用戶,特別適合角色扮演場景。

模型特點

雙階段訓練
採用預訓練延續和微調兩個階段,分別提升創造力和角色扮演能力
高LoRA丟棄率
訓練中採用0.5的LoRA丟棄率,基於最新研究成果優化模型性能
長上下文支持
支持16384 tokens的長上下文處理能力
LoRA+技術
採用LoRA+訓練方法,學習率比率為15,優化訓練效果

模型能力

創意寫作
角色扮演對話
長文本生成
指令跟隨

使用案例

娛樂
角色扮演遊戲
作為遊戲中的角色與用戶進行沉浸式互動
提供高質量的角色扮演體驗
創意寫作輔助
幫助用戶生成創意故事或小說內容
產生富有創意的文本輸出
對話系統
個性化聊天機器人
構建具有特定性格特徵的聊天機器人
提供個性化和一致性的對話體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase