🚀 LLaMA2 - 13B - TiefighterLR
LLaMA2 - 13B - TiefighterLR是一個融合模型,它是在一個成熟的現有融合模型基礎上,進一步融合了兩個不同的LoRA而得到的。這個LR版本減少了“Rodeo”的影響,從原來的5%融合比例降至3%,從而降低了其二人稱冒險傾向。測試者發現,該模型能更好地理解用戶的角色和指令提示,不過會犧牲一些自身的寫作傾向和風格。
🚀 快速開始
本模型可用於多種場景,如故事創作、聊天機器人、指令提示以及冒險遊戲等。使用時,可根據不同需求選擇合適的使用方式。
✨ 主要特性
- 減少冒險傾向:通過調整融合比例,降低了模型的二人稱冒險傾向,使其能更好地理解用戶的角色和指令提示。
- 支持多種格式:作為多種模型的融合,它支持廣泛的指令格式,或普通聊天模式。
- 聚焦虛構創作:雖然也可作為事實性指令模型使用,但重點在於虛構創作,模型提供的信息可能是虛構的。
📚 詳細文檔
模型融合配方
為實現上述特性,採用了以下融合配方:
- 以基礎模型Undi95/Xwin - MLewd - 13B - V0.2 作為起始點,這是一個成熟的融合模型,與名稱不同,該模型並無強烈的NSFW傾向。
- 應用PocketDoc/Dans - RetroRodeo - 13b LoRA,這是在Skein模型的“Choose your own Adventure”數據集上進行微調的結果。
- 將原始模型與新創建的PocketDoc/Dans - RetroRodeo - 13b融合模型以3%的比例進行融合,以削弱新引入的冒險傾向。
- 將得到的融合模型作為新的基礎模型,應用Blackroot/Llama - 2 - 13B - Storywriter - LORA,並再次以10%的比例進行融合。
模型成分
據我們所能追蹤到的,該模型包含其上游模型的以下成分:
- Undi95/Xwin - MLewd - 13B - V0.2
- Undi95/ReMM - S - Light (base/private)
- Undi95/CreativeEngine
- Brouz/Slerpeno
- elinas/chronos - 13b - v2
- jondurbin/airoboros - l2 - 13b - 2.1
- NousResearch/Nous - Hermes - Llama2 - 13b + nRuaif/Kimiko - v2 LoRA
- CalderaAI/13B - Legerdemain - L2 + lemonilia/limarp - llama2 - v2 LoRA
- KoboldAI/LLAMA2 - 13B - Holodeck - 1
- NousResearch/Nous - Hermes - 13b
- OpenAssistant/llama2 - 13b - orca - 8k - 3319
- ehartford/WizardLM - 1.0 - Uncensored - Llama2 - 13b
- Henk717/spring - dragon
- The - Face - Of - Goonery/Huginn - v3 - 13b
- zattio770/120 - Days - of - LoRA - v2 - 13B
- PygmalionAI/pygmalion - 2 - 13b
- Undi95/StoryTelling
- TokenBender/sakhi_13B_roleplayer_NSFW_chat_adapter
- nRuaif/Kimiko - v2 - 13B
- The - Face - Of - Goonery/Huginn - 13b - FP16
- lemonilia/LimaRP - Llama2 - 13B - v3 - EXPERIMENT
- Xwin - LM/Xwin - LM - 13B - V0.2
- PocketDoc/Dans - RetroRodeo - 13b
- Blackroot/Llama - 2 - 13B - Storywriter - LoRA
💻 使用示例
故事創作
續寫故事
支持以傳統方式進行常規故事創作,只需複製粘貼已有故事內容,即可繼續編寫。也可選擇在記憶中使用指令或作者註釋來引導故事的發展方向。
按需生成故事
若要按需生成故事,可使用指令(在Alpaca格式中測試過),例如“Write a novel about X, use chapters and dialogue”,這將生成一個故事。生成的格式可能因模型選擇的開頭方式而異,你可以按照前面的示例寫出你想要的內容,或者自己寫出故事的開頭,讓模型遵循你的風格。若模型生成的內容不符合要求,多嘗試幾次可能會有所幫助。
聊天機器人和角色設定
與原始的Tiefighter模型不同,只要角色卡中不包含大量的第二人稱寫作或第二人稱介紹(“你”),該模型在處理現有角色卡方面表現更佳。將“>”設置為自定義停止序列有助於糾正潛在的錯誤,同時關閉多行回覆功能也有幫助。你還可以使用指令來創建角色。
例如,在常規聊天模式下,你可以在記憶中輸入以下內容:
### Instruction:
Generate a conversation between Alice and Henk where they discuss language models.
In this conversation Henk is excited to teach Alice about Tiefighter.
### Response:
由於該模型是多種模型的融合,它應該支持廣泛的指令格式或普通聊天模式。如果你有特別喜歡的格式,可以嘗試一下;否則,我們建議使用常規聊天模式或Alpaca格式。
指令提示
該模型融合了多種指令模型,支持多種指令風格。在測試模型時,我們使用了Alpaca格式進行測試。如果你更喜歡其他格式,很可能也能正常工作。
在指令提示過程中,我們發現有時冒險數據可能會洩露。使用“>”作為用戶命令的前綴進行實驗可能有助於解決這個問題,但這可能會導致更強的虛構傾向。
請記住,雖然該模型可以用作事實性指令模型,但其重點在於虛構創作。模型提供的信息可能是虛構的。
冒險和冒險遊戲
該模型包含一個在與KoboldAI Skein模型相同的冒險數據集上訓練的LoRA。進行冒險活動時,最好先對世界和目標進行簡要介紹,並使用“>”作為用戶命令的前綴(KoboldAI的冒險模式)。
模型可能不會立即理解你的意圖,不會馬上進入冒險模式。此時,只需手動修正輸出內容,去除多餘的對話或其他不良行為,然後繼續以適當的模式提交你的操作。模型應該能很快適應這種風格,並在三輪交互內正確遵循該格式。
📄 許可證
本模型使用的許可證為llama2。
發現了很酷的東西並想與我們交流?
加入我們的社區:https://koboldai.org/discord !
本模型的實現離不開以下貢獻者的出色工作:
Undi95、PocketDoc、Blackroot、Brouz、The Face of Goonery、zattio770、PygmalionAI、TokenBender、nRuaif、lemonilia和Xwin - LM。